Mango Scraper — Extrae datos de Mango

Scraper de Mango basado en Scrapy y Selenium. Ejecuta corridas completas o por producto.

Información

Demo: https://shop.mango.com/co/
País: Colombia
Estado: ✅ Producción
Python: stylos/spiders/mango.py
Extractor: stylos/extractors/mango_extractor.py
Líneas de código: 416
Dominios: shop.mango.com

Características Implementadas

Navegación por footer: categorías desde enlaces del footer
Categorías: Mujer y Hombre con navegación completa
Extracción avanzada: productos, precios, descripciones, imágenes
Imágenes por color (máx 15 por color) con deduplicación
Scroll progresivo hasta 30 intentos
Selenium integrado con anti-detección
Sistema de precios con detección de descuentos

Capacidades Técnicas

scrapy crawl mango                   # Scraping completo
scrapy crawl mango -a url="URL"     # Producto específico
scrapy crawl mango -o products.json # Exportar resultados

Datos Extraídos

Nombre del producto normalizado
Descripción completa
Precio original y actual
Porcentaje y monto de descuento
Moneda detectada automáticamente (COP)
URL canónica del producto
Imágenes organizadas por color con detección de duplicados
Metadatos de extracción (fecha, sitio)

FAQ

¿Cómo ejecutar el Mango scraper?⌄

Usa scrapy: "scrapy crawl mango" o con un producto específico: "scrapy crawl mango -a url="URL"".

¿Qué datos extrae el Mango scraper?⌄

Nombre, descripción, precio original y actual, descuentos, moneda (COP), URL canónica, imágenes por color y metadatos.

Docker Compose está levantado, ¿puedo correr el scraping con un script que se comunica con la API?⌄

Sí. Usa el script control_scraper.py (se comunica con la API para orquestar el scraping). Ejemplo (ejecución completa): python control_scraper.py --spider mango

¿Buscas también Zara scraper?