- 01
Scrapeamos las vinotecas
Cada noche a las 3 AM (hora Argentina), un workflow corre contra las 61 vinotecas online que tenemos integradas. Leemos sus catálogos públicos vía las APIs estándar de sus plataformas (Tiendanube, WooCommerce, Shopify, VTEX, Magento, PrestaShop) o el HTML cuando no hay API.
Ninguna vinoteca nos da datos privados. Todo lo que leemos es lo mismo que verías vos entrando al sitio.
- 02
Matcheamos el mismo vino
El mismo vino se llama distinto en cada tienda: “Zuccardi Concreto Malbec” vs “Vino Concreto Zuccardi 750ml”. Usamos 4 etapas de matching:
- Stage 0 — Código de barras (EAN): si dos tiendas exponen el mismo GTIN, es el mismo vino. Zero falsos positivos.
- Stage 1 — Nombres normalizados: tokens ordenados alfabéticamente + brand + cosecha + formato. Colapsa la mayoría de casos.
- Stage 2 — Embeddings:pasamos los nombres por OpenAI text-embedding-3-small y medimos similitud coseno. Captura casos como “Don David Reserva Malbec” vs “Don David Malbec Reserva”.
- Stage 3 — LLM adjudicator:los pares en “zona gris” (similitud entre 0.85 y 0.93) se los preguntamos a GPT-4o-mini: “¿es el mismo vino?”. Resuelve los casos difíciles.
- 03
Filtramos ofertas reales
Muchos catálogos online dejan productos “sin stock” con un precio bajísimo de hace meses. Si contamos ese precio como oferta, te mostramos un “ahorrá 70%” falso. Por eso los precios del grupo (min, max, ahorro) se calculan SOLO con ofertas in-stock. Las sin stock igual aparecen en la ficha, pero con un badge claro y no cuentan.
- 04
Te mostramos la comparación
Todo esto se empaqueta en
data/snapshot.jsony se deploya automáticamente. Cuando entrás a una ficha, ves las tiendas ordenadas de menor a mayor precio, con diferencia porcentual vs el mínimo y CTA para ir directo a la compra.
Última actualización
24 de abril de 2026 a las 8:47 a. m. · Snapshot con 61 vinotecas, 46.648 ofertas, 4.025 vinos comparables en 2+ tiendas.
Podés ver el breakdown completo por plataforma en /admin/fuentes.