Saltar al contenido

Mango Scraper — Extrae datos de Mango

Scraper de Mango basado en Scrapy y Selenium. Ejecuta corridas completas o por producto.

Información

Características Implementadas

  • Navegación por footer: categorías desde enlaces del footer
  • Categorías: Mujer y Hombre con navegación completa
  • Extracción avanzada: productos, precios, descripciones, imágenes
  • Imágenes por color (máx 15 por color) con deduplicación
  • Scroll progresivo hasta 30 intentos
  • Selenium integrado con anti-detección
  • Sistema de precios con detección de descuentos

Capacidades Técnicas

scrapy crawl mango                   # Scraping completo
scrapy crawl mango -a url="URL"     # Producto específico
scrapy crawl mango -o products.json # Exportar resultados

Datos Extraídos

  • Nombre del producto normalizado
  • Descripción completa
  • Precio original y actual
  • Porcentaje y monto de descuento
  • Moneda detectada automáticamente (COP)
  • URL canónica del producto
  • Imágenes organizadas por color con detección de duplicados
  • Metadatos de extracción (fecha, sitio)

FAQ

¿Cómo ejecutar el Mango scraper?

Usa scrapy: "scrapy crawl mango" o con un producto específico: "scrapy crawl mango -a url="URL"".

¿Qué datos extrae el Mango scraper?

Nombre, descripción, precio original y actual, descuentos, moneda (COP), URL canónica, imágenes por color y metadatos.

Docker Compose está levantado, ¿puedo correr el scraping con un script que se comunica con la API?

Sí. Usa el script control_scraper.py (se comunica con la API para orquestar el scraping). Ejemplo (ejecución completa): python control_scraper.py --spider mango

¿Buscas también Zara scraper?