Arepa.AI: Plataforma de IA Agencial para PyMEs de Habla Hispana

Arepa.AI: Plataforma de IA Agencial para PyMEs de Habla Hispana | Celestinosalim.com

Arepa.AI: Plataforma de IA Agencial para PyMEs de Habla Hispana

Los pequeños negocios en América Latina operan en una realidad distinta a las startups de Silicon Valley. No tienen equipos de ingeniería. No tienen infraestructura de datos. Muchos ni siquiera tienen sitio web. Pero enfrentan los mismos problemas operativos que la IA puede resolver: responder preguntas de clientes, agendar citas, gestionar inventario y dar seguimiento a leads.

Arepa.AI es la plataforma que estoy construyendo para cerrar esa brecha. El nombre es un guiño a mis raíces venezolanas: la arepa es la comida más universal de la cultura, y este proyecto busca hacer la IA igual de accesible.

El problema

La mayoría de las herramientas de IA asumen inglés como idioma principal, escala enterprise y usuarios técnicos. Eso deja fuera a millones de pequeños negocios en América Latina que podrían beneficiarse de la automatización, pero no pueden pagar un contrato de consultoría de $200K ni navegar documentación en inglés.

Los vacíos específicos que estoy atacando:

Idioma: El rendimiento de los LLM se degrada significativamente en español, especialmente con dialectos regionales y comunicación empresarial informal
Costo: Las PyMEs no pueden justificar $0.50/consulta. La economía unitaria necesita funcionar a $0.01/consulta o menos
Complejidad: Los dueños de negocio necesitan interactuar con IA a través de voz y WhatsApp, no dashboards

Tech Stack

| Capa | Tecnología | Justificación | |---|---|---| | Orquestación de agentes | LangGraph | Máquinas de estado sobre cadenas: los flujos de negocio mapean naturalmente a grafos de estado | | Observabilidad | LangSmith | Visibilidad completa de trazas para depurar casos edge en español | | Vector Store | Supabase (pgvector) | Namespace aislado por negocio, soporte de embeddings multilingüe | | Embeddings | Modelo multilingüe | Preserva precisión semántica entre dialectos del español | | Infraestructura | AWS (Lambda, S3, CloudWatch) | Ejecución serverless con aislamiento de costos por negocio | | IaC | Terraform | Toda la infraestructura como código desde el día uno | | Voz | LiveKit | El mismo stack de celestino.ai |

Decisiones de arquitectura

LangGraph para orquestación de agentes

Elegí LangGraph sobre LangChain puro u orquestación custom por tres razones:

Máquinas de estado sobre cadenas: Los flujos de negocio (calificación de leads, agendamiento de citas, secuencias de seguimiento) mapean naturalmente a grafos de estado, no a cadenas lineales
Human-in-the-loop: Los dueños de PyMEs necesitan aprobar acciones antes de que el agente las ejecute. El modelo interrupt/resume de LangGraph resuelve esto limpiamente
Observabilidad: La integración con LangSmith da visibilidad completa de trazas, algo crítico cuando estás depurando casos edge en español

Pipeline RAG

La capa de retrieval ingesta contenido específico del negocio: menús, listas de servicios, precios, preguntas frecuentes y horarios de operación. Cada negocio obtiene un namespace vectorial aislado en Supabase (pgvector).

Decisiones clave de diseño:

Estrategia de chunking: Chunking semántico afinado para límites de oraciones en español
Modelo de embeddings: Modelo multilingüe (no solo inglés) para preservar precisión semántica
Búsqueda híbrida: Combinando similaridad vectorial con coincidencia de keywords para nombres propios (nombres de negocios, nombres de productos) que los embeddings manejan mal

Infraestructura

AWS: Lambda para ejecución de agentes, S3 para almacenamiento de documentos, CloudWatch para monitoreo
Terraform: Toda la infraestructura es IaC desde el día uno. Nada de clicks en consolas
Tope de costo: Límites duros en el gasto mensual por negocio. Si el agente de un negocio cuesta más de $50/mes, algo está mal con la arquitectura

Estado actual

Este proyecto está en desarrollo activo. Lo que ya funciona:

Framework core de agentes con gestión de estado LangGraph
Pipeline RAG con chunking y retrieval optimizados para español
Prototipo de interfaz de voz usando el mismo stack de LiveKit de celestino.ai
Módulos Terraform para despliegue multi-tenant en AWS

Lo que sigue:

Integración con WhatsApp Business API como canal principal de clientes
Facturación y medición de uso por negocio
Flujo de onboarding que permita a dueños de negocio configurar su agente sin código

Justificación técnica

Estoy construyendo Arepa.AI porque está en la intersección de todo lo que he aprendido: ingeniería de IA en producción de Eventbrite, diseño de pipelines de datos de FlowWest, y pensamiento de producto de construir celestino.ai. También es la versión más difícil del problema: hacer que la IA funcione de forma confiable en un idioma y un mercado que la mayoría de las herramientas ignora.

Esto no es un demo. Es un negocio que estoy construyendo en público, con el mismo rigor de ingeniería que llevaría a cualquier sistema en producción.

Trabaja Conmigo en Algo Similar

Si estás construyendo IA para mercados no angloparlantes, automatización multilingüe para PyMEs, o pipelines RAG en producción con restricciones reales de costo, las decisiones de arquitectura documentadas aquí aplican directamente. El mismo pensamiento sistémico (economía unitaria, grounding multilingüe, infraestructura multi-tenant) se transfiere a cualquier dominio.

Explorar Servicios de Consultoría de IA o enviar una consulta - respondo dentro de un día hábil.

Manito Car Wash: IA práctica para un autolavado familiar en Venezuela