Zara Scraper — Extrae datos de Zara por país/idioma

Scraper de Zara con soporte multi‑país y multi‑idioma usando Selenium, Scrapy y Scrapyd. Ideal para e‑commerce de moda.

Información

Demo: https://www.zara.com/co/
País: Colombia
Estado: ✅ Producción
Python: stylos/spiders/zara.py
Extractor: stylos/extractors/zara_extractor.py
Líneas de código: 596
Dominios: zara.com, www.zara.com, zara.net, static.zara.net, zara.com.co

Características Implementadas

Navegación completa de menús dinámicos (hamburguesa + categorías)
Categorías: MUJER y HOMBRE con subcategorías completas
Extracción avanzada: productos, precios, descripciones, imágenes
Imágenes por color organizadas por variantes
Scroll infinito con productos lazy-loaded
Selenium integrado con anti-detección
Sistema de precios con detección de descuentos

Capacidades Técnicas

scrapy crawl zara                    # Scraping completo
scrapy crawl zara -a url="URL"      # Producto específico
scrapy crawl zara -o products.json  # Exportar resultados

Datos Extraídos

Nombre del producto normalizado
Descripción completa
Precio original y actual
Porcentaje y monto de descuento
Moneda detectada automáticamente
URL canónica del producto
Imágenes organizadas por color
Metadatos de extracción (fecha, sitio)

FAQ

¿Cómo ejecutar el Zara scraper?⌄

Usa scrapy: "scrapy crawl zara" o con un producto específico: "scrapy crawl zara -a url="URL"".

¿Qué datos extrae el Zara scraper?⌄

Nombre, descripción, precio original y actual, descuentos, moneda, URL canónica, imágenes por color y metadatos.

Docker Compose está levantado, ¿puedo correr el scraping con un script que se comunica con la API?⌄

Sí. Usa el script control_scraper.py (se comunica con la API para orquestar el scraping). Ejemplo (Colombia por defecto): python control_scraper.py --spider zara

¿Buscas también Mango scraper?