Coolbox — Agentes IA de soporte a la venta, sin costo por token.
IA agéntica desplegada on-premise con Apu AI: agentes conversacionales asisten al equipo comercial en tiempo real, sin costo variable por consulta, sin enviar datos sensibles del cliente a la nube. Cero token. CAPEX fijo. Datos dentro de Coolbox.
Costo por consulta
$0
CAPEX único, no OPEX variable
Datos del cliente
100% on-premise
nunca salen de la red
Vertical
Retail tech
soporte comercial 24/7
Sobre el cliente
Coolbox
Retail tech · Perú
Cadena peruana líder en tecnología de consumo y soluciones digitales para el hogar y el trabajo. Opera presencia física + ecommerce con volumen alto de consultas comerciales: producto, compatibilidad, disponibilidad, integraciones, servicio post-venta.
Su área comercial atiende un flujo constante de preguntas técnicas que históricamente dependían del conocimiento del vendedor o del tiempo de búsqueda en catálogos. La oportunidad: dotar al equipo comercial de un copiloto IA que responda en segundos — sin que cada consulta genere una factura de tokens en la nube.
El reto
Escalar IA en el área comercial sin disparar costo ni exponer datos.
Costo variable impredecible
Las soluciones de IA cloud cobran por token. Escalar el uso real (todo el equipo comercial, todos los días, todas las consultas) hace explotar el presupuesto. El CFO no puede comprometer presupuesto a una factura que crece con cada conversación.
Datos sensibles del cliente
Las consultas incluyen información de clientes, historial de compras, datos comerciales. Enviar todo eso a un modelo externo (OpenAI, Anthropic, Google) implica exposición legal, regulatoria y de competencia.
Lock-in con un único proveedor
Construir la operación sobre un modelo cloud específico ata al vendor: si suben precios, cambian políticas o discontinúan modelos, el negocio queda rehén. Un retail no puede asumir ese riesgo en su capa de IA productiva.
La solución
Apu AI · IA Soberana llave en mano sobre infraestructura de Coolbox.
Cuatro capas que convierten un caso de uso aislado en una capacidad estructural de IA al servicio del negocio.
Apu AI desplegado on-premise
Modelos open-source de élite (Llama, Qwen, Gemma) desplegados directamente en la infraestructura de Coolbox sobre GPUs Nvidia. Sin enviar dato alguno a proveedores cloud. Una sola inversión inicial, uso ilimitado.
Fine-tuning con datos propios
Los modelos se adaptan al catálogo, al lenguaje técnico de Coolbox y al historial de consultas comerciales. La IA habla el idioma del negocio, no el genérico del modelo base.
Agentes conversacionales para el equipo comercial
Asistentes IA accesibles desde el flujo de trabajo del vendedor: responden consultas técnicas, validan compatibilidades, generan respuestas a clientes, sugieren productos relacionados. En tiempo real, sin esperar.
Roadmap: avatares conversacionales
Próxima etapa en evaluación: avatares con presencia visual y voz para atención directa al cliente (online y en tienda). Multimodal nativo: ven, escuchan y responden. El soporte se vuelve cara visible de la marca, escalable sin contratar más personas.
Stack técnico
Modelos LLM open-source: familia Llama (Meta), Qwen (Alibaba), Gemma (Google) en variantes de tamaño según caso de uso. Hardware: GPUs Nvidia desplegadas en infraestructura del cliente. Capacidades: agentes conversacionales, RAG (recuperación aumentada sobre catálogo y documentación), integraciones a sistemas existentes vía APIs. Roadmap: avatares conversacionales con voz y video para atención al cliente final.
El impacto
IA productiva sin sorpresas en la factura ni en la auditoría.
Costo predecible — adiós a la factura variable
Inversión única en infraestructura + setup. Uso ilimitado de la IA por todo el equipo comercial sin que cada consulta sume al gasto. Modelo CAPEX que el CFO puede planificar.
Datos del cliente nunca salen de Coolbox
Toda la conversación, historial, catálogo y dato comercial permanece dentro de la red. Cumplimiento natural ante regulación de protección de datos y políticas internas de gobierno corporativo.
Equipo comercial más rápido y mejor informado
El vendedor responde en segundos lo que antes tomaba minutos de búsqueda manual. Más tiempo para vender, menos tiempo perdido en encontrar la respuesta correcta.
Capacidad de IA escalable a nuevos casos
La misma infraestructura sirve para agregar nuevos agentes y casos sin costos marginales: análisis documental, búsqueda interna, atención al cliente final con avatares. Cada caso nuevo es feature, no proyecto desde cero.
*Métricas cuantitativas específicas del despliegue de Coolbox se actualizarán cuando se documenten formalmente.
Por qué este caso importa
Para tu directorio · Para tu CFO · Para tu CIO.
Para el directorio
Capacidad estratégica de IA
La IA deja de ser experimento o demo y se vuelve infraestructura productiva al servicio de la operación. El board puede comunicar capacidad real de IA sin dependencia externa.
Para el CFO
CAPEX predecible, sin OPEX exponencial
Una sola inversión. Cero factura recurrente por uso. La adopción interna no se ve frenada por preocupación de costo. Modelo presupuestable y defendible ante auditoría.
Para el CIO
Soberanía, sin lock-in
Modelos open-source de élite sobre infraestructura propia. Cambio de modelo sin migración de datos. Continuidad operativa garantizada. Cumplimiento con políticas de protección de información.
¿IA productiva en tu empresa? Sin tokens variables, sin enviar dato a la nube.
Diagnóstico de 60 minutos para mapear casos de uso de IA en tu operación. Te decimos honestamente si Apu AI on-premise tiene sentido económico y técnico para tu volumen.