¿Cómo scrapear datos web?3 min de lectura

¿Cómo scrapear datos web?<span class="wtr-time-wrap after-title"><span class="wtr-time-number">3</span> min de lectura</span>

Extraer contenido web utilizando Screaming Frog es posible. Web scraping (raspado de páginas web) consiste en la extracción de datos significativos de una web. Existen diferentes herramientas para scrapear datos web, pero en este caso nos centraremos en la oportunidad que nos ofrece Screaming Frog 🐸.

Screaming Frog es capaz de presentarnos toda esta información o incluso automatizar la extracción en un periodo de tiempo concreto.

¿Que datos web podemos extraer?

La información que podemos extraer es amplia y variada, pero puede ser útil para extraer datos que componen la arquitectura web de, por ejemplo, un e-commerce:

Número de categorías por producto

Número de productos por categoría

Seguimiento de precios

¿Cómo extraer contenido web?

Tenemos tres métodos disponibles para la extracción, usaremos el lenguaje XPath que busca dentro un documento XML.

CSS Path: nos permite consultar los selectores de ruta CSS.

XPath: nos permite consultar los elementos HTML.

Regex: expresiones para extraer HTML y Javascript.

Nos centraremos en XPath para extraer la información que nos interesa, entre otros elementos podemos extraer:

//title Title

//h1 H1

//h2 H2

//h3 H3

//meta/@content Meta description

//img/@src URL imagen

//img/@alt ALT imagen

//link/@href Enlace AMP

¿Cómo obtener Xpath desde Google Chrome?

Para obtener el Xpath con un elemento seleccionado hacemos clic en el botón derecho, inspeccionar. Volvemos a hacer clic en Copy / Copy Xpath.

ejemplo de extraer el xpath

De esta forma ya tenemos copiado en el portapapeles el elemento en XPath para utilizarlo en cualquier herramienta. Podemos utilizar la extensión Chrome Xpath Helper para comprobar que estamos extrayendo la información correcta.

ejemplo de ecommerce con herramienta xpath helper
Fuente: Website El Corte Inglés, XPath Helper Chrome Extension

Custom extraction Screaming Frog

Podemos generar la extracción a través de la funcionalidad Custom Extraction de Screaming Frog. Tenemos que seguir la siguiente ruta: Configuración / Custom / Extraction.

ejemplo de custom extraction de screaming frog
Fuente: Screaming Frog

En el siguiente paso podemos añadir los campos incluyendo el XPath que nos interese extraer.

ejemplo de extraer xpath en screaming frog
Fuente: Screaming Frog

Una vez tengamos los campos seleccionados es hora de importar los datos y trabajar con ellos para analizar la información de una manera más gráfica.

Resumen
¿Cómo scrapear datos web?
Nombre del artículo
¿Cómo scrapear datos web?
Descripción
Descubre como scrapear datos web para SEO con XPath. Utiliza la función Custom Extraction de Screaming Frog 🐸
Autor

José Vicente Ribes

Soy José Vicente Ribes, Especialista en Marketing Digital y Ventas . Concretamente especializado en procesos comerciales digitalizados y técnicas de visibilidades, como SEO (Search Engine Optimization) y SEM (Search Engine Marketing).

Deja una respuesta