Inteligencia artificial en sourcing: nuestro roadmap

Cada dos semanas alguien me manda un pitch de "AI sourcing platform" diciendo que va a reemplazar a los agentes en China. Lo abro, lo leo entero, y el 95% de las veces termino cerrándolo con la misma sensación: esto lo arma alguien que nunca pisó una fábrica en Yiwu. Este post es lo opuesto: lo que realmente estamos haciendo con IA adentro de B2BOX, lo que sí mueve la aguja, y lo que no la va a mover nunca por más GPT-5 que saquen.

El hype de "AI sourcing" es 90% marketing

Vengo de electrónica (UPC), hice el MSc en Robótica en La Salle Barcelona, después un EMBA en EAE, fundé y vendí Pluxer en 2023. No soy anti-IA, soy lo contrario: la uso todos los días y la metí en producción donde tenía sentido. Pero justamente por eso me molesta cuando veo decks que prometen "AI-powered sourcing end-to-end". Es vender humo.

El sourcing real no es un problema de información, es un problema de confianza distribuida: vos confiás en alguien que confía en una fábrica que cumple lo que firma. Eso no se resuelve con un LLM. Se resuelve con gente que vive en Yiwu hace 14 años y conoce al dueño de la fábrica por nombre. Lo cuento más a fondo en la historia de Paola y en cómo trabajamos.

Dicho eso, hay tres lugares concretos donde sí estamos invirtiendo plata y horas en IA. Te los cuento sin filtro.

Los tres lugares donde IA sí mueve la aguja

1. Clasificación automática de catálogos chinos

El problema más caro y aburrido del sourcing arranca en la primera hora: un cliente te manda un link de Alibaba o de 1688, vos tenés que entender qué es el producto, cómo se llama "bien" en español, qué HS code le corresponde para aduana en Argentina o Chile, y qué especificaciones reales tiene más allá del título-keyword-stuffing chino. Multiplicalo por 200 SKUs y entendés por qué los agentes tradicionales tardan tres semanas en cotizar.

Acá la IA sí sirve. Armamos un pipeline propio que combina scraping de Alibaba y 1688 con LLMs (mezclamos APIs de OpenAI y Anthropic según el caso) que normaliza:

Títulos chinos basura a descripciones limpias en español, portugués o inglés.
Specs sueltas (materiales, voltajes, dimensiones) a un esquema consistente.
Sugerencia inicial de HS code, que después un humano del equipo valida contra la posición arancelaria real de destino.

No reemplaza al equipo de sourcing. Le saca de encima 4 horas de carga cognitiva por brief, y eso es muchísimo cuando estás corriendo 60 cotizaciones en paralelo.

2. Detección de productos virales TikTok/Douyin con visión computacional

Esto es lo más divertido que estamos construyendo. Douyin y TikTok son hoy el termómetro más rápido del mundo para saber qué producto está a punto de explotar en LATAM con 3 a 6 meses de delay. El problema es el volumen: hay millones de videos por día y la mayoría no son tendencia, son ruido.

Tenemos un sistema que combina visión computacional para identificar productos físicos dentro de los videos con métricas de engagement, y devuelve una lista corta de productos "calientes" que después el equipo cross-checkea contra disponibilidad real en Yiwu. Cuando matchea, mandamos muestras antes que la categoría sature. Esto le sirve sobre todo a clientes ecommerce que necesitan rotar catálogo rápido.

3. Generación de fichas técnicas multi-idioma

Una vez que el producto está cotizado y aprobado, viene la parte que nadie quiere hacer: armar la ficha técnica para ecommerce, para aduana, y a veces para certificación. Specs en chino, ficha final en español para Mercado Libre, en portugués para Shopee Brasil, en inglés para Amazon. Antes esto se hacía a mano y era una semana de trabajo. Hoy lo arrancamos automatizado y el equipo solo edita los matices culturales y comerciales. Es 80% de ahorro de tiempo en una tarea que era pura fricción.

Dónde IA no va a llegar (ni en 2026, ni en 2028)

Esta es la parte donde difiero fuerte con casi todos los pitches que escucho. Hay cosas que no se automatizan no porque "todavía no", sino porque el problema en sí no es computable. Acá el cuadro mental con el que operamos:

Tarea	¿IA suma?	Por qué
Normalizar catálogos chinos	Sí, mucho	Es procesamiento de lenguaje, datos abundantes, error tolerable.
Detectar tendencias virales	Sí	Visión + métricas públicas. La IA es más rápida que cualquier humano.
Generar fichas técnicas	Sí	Output estructurado, edición humana posterior.
Negociar precio con fábrica	No	Negociación china es relacional. Un LLM no toma té con el dueño.
Decidir qué proveedor usar	No	50% datos, 50% reputación informal que no está escrita en ningún lado.
QC físico del lote	No	Tocar el plástico, oler el pegamento, abrir 1 de cada 50 cajas. Visión no alcanza.
Entender cultura de fábrica	No	Saber si el dueño te miente requiere haberlo visto mentir antes.

El error más común que veo en founders tech que entran a este sector es pensar que sourcing es un problema de información asimétrica. No lo es. Es un problema de juicio, y el juicio se entrena con años de cagadas propias. Por eso no vamos a reemplazar a Paola con IA, ni ahora ni nunca: la confianza no se entrena en un dataset.

El stack que estamos usando

Para que esto no quede en abstracto, el stack interno es deliberadamente simple: Python para todo lo de scraping y pipelines, Supabase como base de datos y backend, APIs de OpenAI y Anthropic según el caso de uso, y herramientas propias de scraping para Alibaba y 1688 que mantenemos nosotros porque las soluciones genéricas se rompen cada dos semanas. Nada exótico. La complejidad real no está en el stack, está en los prompts, en la limpieza de datos, y en el ciclo humano de validación que rodea cada output del modelo.

Soy bastante religioso con esto: nunca dejamos un output de LLM ir directo al cliente sin pasar por un humano del equipo. Ni cotizaciones, ni fichas, ni HS codes. Es lo que me permite dormir tranquilo.

Qué viene en 2026

Dos cosas concretas que estamos construyendo y que probablemente salgan este año:

Un agente de cotización que pregunta lo justo. Hoy si un cliente entra a la calculadora, le pedimos los datos mínimos y devolvemos un costo estimado. La próxima versión va a hacer 3 o 4 repreguntas inteligentes según la categoría del producto (porque un brief de cosmética y uno de electrónica tienen variables distintas), y va a llegar a una cotización más precisa sin saturar al cliente con un formulario de 40 campos.
Un assistant interno para el equipo de ventas. Tenemos 19 personas distribuidas en Yiwu, Buenos Aires y Barcelona, y mucho conocimiento operativo vive en Slack, en notas, en correos. El assistant interno va a permitir que cualquiera del equipo pregunte "¿cómo cotizamos la última vez una cápsula tipo X con producción en Ningbo?" y obtenga respuesta en segundos, en lugar de buscar a tientas. No es revolucionario, es plomería.

Cierre: pragmáticos, no tecno-optimistas

Resumiendo mi posición y la de B2BOX: la IA es una herramienta brutalmente útil para la capa de información del sourcing, y prácticamente inútil para la capa de relación. Confundir las dos es lo que hace que la mayoría de plataformas "AI sourcing" se vayan a la quiebra después de la ronda seed. Nosotros invertimos donde la pala mueve tierra de verdad y cuidamos con vida la otra mitad, la humana, porque es la que nuestros clientes nos pagan por tener.

Si querés ver cómo se traduce esto en una operación real, mirá cómo trabajamos, conocé al equipo fundador, o jugá con la calculadora. Y si te genera curiosidad alguna parte específica del stack, escribime, es de los temas que más me divierten.