Zara Scraper — Extrae datos de Zara por país/idioma
Scraper de Zara con soporte multi‑país y multi‑idioma usando Selenium, Scrapy y Scrapyd. Ideal para e‑commerce de moda.
Información
- Demo: https://www.zara.com/co/
- País: Colombia
- Estado: ✅ Producción
- Python: stylos/spiders/zara.py
- Extractor: stylos/extractors/zara_extractor.py
- Líneas de código: 596
- Dominios: zara.com, www.zara.com, zara.net, static.zara.net, zara.com.co
Características Implementadas
- Navegación completa de menús dinámicos (hamburguesa + categorías)
- Categorías: MUJER y HOMBRE con subcategorías completas
- Extracción avanzada: productos, precios, descripciones, imágenes
- Imágenes por color organizadas por variantes
- Scroll infinito con productos lazy-loaded
- Selenium integrado con anti-detección
- Sistema de precios con detección de descuentos
Capacidades Técnicas
scrapy crawl zara # Scraping completo
scrapy crawl zara -a url="URL" # Producto específico
scrapy crawl zara -o products.json # Exportar resultados
Datos Extraídos
- Nombre del producto normalizado
- Descripción completa
- Precio original y actual
- Porcentaje y monto de descuento
- Moneda detectada automáticamente
- URL canónica del producto
- Imágenes organizadas por color
- Metadatos de extracción (fecha, sitio)
FAQ
¿Cómo ejecutar el Zara scraper?⌄
Usa scrapy: "scrapy crawl zara" o con un producto específico: "scrapy crawl zara -a url="URL"".
¿Qué datos extrae el Zara scraper?⌄
Nombre, descripción, precio original y actual, descuentos, moneda, URL canónica, imágenes por color y metadatos.
Docker Compose está levantado, ¿puedo correr el scraping con un script que se comunica con la API?⌄
Sí. Usa el script control_scraper.py (se comunica con la API para orquestar el scraping). Ejemplo (Colombia por defecto): python control_scraper.py --spider zara
¿Buscas también Mango scraper?