Mango Scraper — Extrae datos de Mango
Scraper de Mango basado en Scrapy y Selenium. Ejecuta corridas completas o por producto.
Información
- Demo: https://shop.mango.com/co/
- País: Colombia
- Estado: ✅ Producción
- Python: stylos/spiders/mango.py
- Extractor: stylos/extractors/mango_extractor.py
- Líneas de código: 416
- Dominios: shop.mango.com
Características Implementadas
- Navegación por footer: categorías desde enlaces del footer
- Categorías: Mujer y Hombre con navegación completa
- Extracción avanzada: productos, precios, descripciones, imágenes
- Imágenes por color (máx 15 por color) con deduplicación
- Scroll progresivo hasta 30 intentos
- Selenium integrado con anti-detección
- Sistema de precios con detección de descuentos
Capacidades Técnicas
scrapy crawl mango # Scraping completo
scrapy crawl mango -a url="URL" # Producto específico
scrapy crawl mango -o products.json # Exportar resultados
Datos Extraídos
- Nombre del producto normalizado
- Descripción completa
- Precio original y actual
- Porcentaje y monto de descuento
- Moneda detectada automáticamente (COP)
- URL canónica del producto
- Imágenes organizadas por color con detección de duplicados
- Metadatos de extracción (fecha, sitio)
FAQ
¿Cómo ejecutar el Mango scraper?⌄
Usa scrapy: "scrapy crawl mango" o con un producto específico: "scrapy crawl mango -a url="URL"".
¿Qué datos extrae el Mango scraper?⌄
Nombre, descripción, precio original y actual, descuentos, moneda (COP), URL canónica, imágenes por color y metadatos.
Docker Compose está levantado, ¿puedo correr el scraping con un script que se comunica con la API?⌄
Sí. Usa el script control_scraper.py (se comunica con la API para orquestar el scraping). Ejemplo (ejecución completa): python control_scraper.py --spider mango
¿Buscas también Zara scraper?