Resumen del webinar: Cómo Cars24 automatiza más de 3 millones de minutos de llamadas de ventas con voz IA

cars-24-bta-cover

Cars24utiliza agentes de voz en producción a gran escala en 13 idiomas.

En este artículo resumimos Detrás del agente: Cómo Cars24 automatiza más de 3 millones de minutos de llamadas de ventas con voz IA con Jayesh Gupta, Head of AI and Innovation en Cars24, que explicó paso a paso cómo crearon y desplegaron su sistema de voz IA: desde el primer caso de uso sencillo hasta una arquitectura multiagente que gestiona millones de minutos de conversaciones con clientes.

Por qué importa la voz IA a esta escala

Cars24 es uno de los mayores marketplaces de coches de segunda mano en India, con operaciones en India, Emiratos Árabes Unidos y Australia. Venden entre 4.000 y 4.500 coches al mes, realizan más de 100.000 inspecciones y facilitan más de 22.000 pruebas de conducción.

Y eso sin contar la financiación, el soporte postventa, el pago de multas y los préstamos sobre coches. Solo el embudo de ventas dura entre 30 y 45 días por cliente.

El 75% de sus compradores adquiere su primer coche. Para estos clientes, comprar un coche no es solo una transacción: es una decisión importante a nivel económico y emocional. Por eso, el 70-80% del producto Cars24 no es la app, es la conversación. Ventas humanas, guiadas y asistidas en cada etapa del proceso.

Antes de los agentes IA, el sistema se ralentizaba. Los clientes llamaban a equipos equivocados: el equipo de ventas recibía consultas de soporte, lo que generaba más esperas y una experiencia menos eficiente.

Los tiempos de espera aumentaban y se perdían seguimientos a lo largo de un embudo de 30 días.

Gestionar todo, desde la cualificación de leads hasta la documentación de préstamos, era caro y difícil de escalar.

Hoy:

  1. El 25% del volumen de llamadas está automatizado
  2. Casi la mitad de las ventas cuenta con asistencia de voz IA
  3. El coste de las llamadas ha bajado un 50%

Demo 1: El agente de negociación de Cars24

Escenario: Un agente de voz de Cars24 llama a un vendedor que está pensando en vender su coche y negocia en hindi para convencerle de elegir Cars24 frente a otras plataformas.

Lo que se mostró:

- El agente lleva a cabo toda la negociación de ventas en hindi

- Gestiona objeciones y compite en tiempo real con otras plataformas

- La conversación suena natural, con baja latencia y sin pausas robóticas

- El agente consigue que el vendedor se comprometa con Cars24 durante la llamada

Por qué es relevante:Estos agentes hacen ventas activas, gestionan la ambigüedad, responden a objeciones y logran conversiones, todo en el idioma en el que el cliente se siente más cómodo. Cars24 ha comprobado que adaptar el idioma aumenta el tiempo de conversación y mejora los resultados.

Demo 2: Orquestación multiagente para hacer cross-sell

Escenario: Un cliente ha perdido una cita de inspección. Un agente de cualificación llama para reprogramar, detecta intención de mejora y transfiere la llamada en directo a un agente de ventas, que continúa la conversación sin perder el contexto.

Lo que se mostró:

- Agente 1 (Sneha) empieza abordando la cita perdida y la reprograma

- Sneha indaga la intención: ¿el vendedor quiere mejorar su coche o vende por motivos económicos?

- El cliente muestra intención de mejora

- Sneha ofrece transferir la llamada al equipo adecuado y lo hace durante la llamada

- El agente 2 retoma la conversación con todo el contexto y la orienta hacia la compra de un coche de segunda mano

- Cuando el cliente pide que le llamen en una hora, el agente lo confirma, repasa el estado de la cita y termina la llamada correctamente

Por qué es relevante:Esta demo muestra cómo funciona la orquestación multiagente en la práctica. Cada agente se encarga de una tarea y el contexto pasa de uno a otro. No hay repeticiones ni traspasos fallidos. Cars24 avanza hacia un único número 24/7 donde el cliente puede gestionar todo su proceso —vender, comprar, financiar— sin tener que repetirse.

Cómo lo construyó Cars24: consideraciones técnicas

Cars24 empezó con el caso de uso más sencillo: recordatorios de citas perdidas. Llamadas cortas, resultados binarios y bajo riesgo de error. Así aprendieron qué funcionaba antes de ampliar el sistema.

Al pasar a llamadas entrantes más largas y complejas —conversaciones de descubrimiento de coches de unos 7 minutos, a veces hasta 13—, se toparon con el límite de las arquitecturas de agente único.

Los modelos pequeños perdían el contexto a partir de los 3-4 minutos.

Los modelos grandes introducían latencia.

Meterlo todo en un solo prompt hacía el sistema frágil: un cambio en el flujo de préstamos podía romper el de compra.

La solución fue la orquestación multiagente. Dividieron la conversación en etapas:

  1. Un agente pequeño de cualificación con un modelo mini capta la intención inicial
  2. Un modelo más grande toma el relevo para el descubrimiento cuando el cliente está implicado y dispuesto a esperar un poco más
  3. Un tercer agente centrado en préstamos solo se activa si se habla de precio o financiación.

Cada agente hace bien una cosa. Los cambios en uno no afectan a los demás.

La arquitectura final (orquestada con la plataforma ElevenAgents):

  1. Voz a texto: ElevenLabs Scribe v2 en tiempo real, elegida por su precisión en entornos ruidosos de nivel 2 y 3 en 13 idiomas
  2. Texto a voz: ElevenLabs Flash 2.5, recientemente actualizado al modo expresivo V3 con mejora demostrada en ventas
  3. LLM: GPT-4.1 mini para la mayoría de casos, y GPT-4o o equivalente para llamadas de descubrimiento más largas que requieren razonamiento avanzado
  4. Telefonía: WebSockets con PCM a 24kHz para calidad de audio; sus proveedores incluyen Twilio, Exotel y Plivo en India
  5. Integraciones: llamadas API personalizadas en la plataforma ElevenLabs Agents, soporte MCP e integración nativa con HubSpot para el mercado australiano
  6. Base de datos vectorial: Qdrant, usando cuantización binaria para grandes volúmenes (más de un millón de vectores) y así mantener baja la latencia y el coste

La decisión de usar ElevenLabs Agents en vez de montar componentes STT, LLM y TTS por separado se debió a una razón: la latencia.

Construir el pipeline por su cuenta, incluso con los mismos modelos, elevaba la latencia por encima de un segundo.

Buenas prácticas de Cars24

Buenas prácticas de Cars24

1. Empieza donde el coste de fallar sea más bajo.El primer caso de uso de Cars24 fueron los recordatorios de citas perdidas: llamadas cortas, simples y de bajo riesgo. Demostrar el modelo ahí generó credibilidad interna y permitió aprender antes de abordar partes más valiosas del embudo.

2.Hazlo con clientes reales, no simulaciones.Las pruebas internas no replican el caos de las conversaciones reales. Cars24 probó sus pilotos con el 10% del tráfico real, aceptó una bajada temporal y usó el feedback real para iterar.

3. Pon un límite estricto a la longitud del prompt. Cars24 limita los prompts a 4.000-5.000 tokens para llamadas de menos de dos minutos. Prompts más largos ralentizan el modelo y no mejoran los resultados. Si un caso necesita más, crea otro agente.

4.Pon las respuestas habituales en el prompt, no en la base de conocimiento.Para las preguntas más frecuentes de los clientes, pon las respuestas directamente en el prompt. Reserva las llamadas a herramientas y la recuperación RAG para el 20% restante. Así se evitan la mayoría de picos de latencia en búsquedas de información.

5.Pregraba el primer mensaje.ElevenLabs Agents puede pre-generar y guardar el mensaje de apertura antes de conectar la llamada. Si además haces que ese mensaje no se pueda interrumpir, reduces las desconexiones tempranas por lag de red o interrupciones prematuras.

6.Evalúa cada llamada.Cars24 usa las evaluaciones de ElevenLabs Agents en el 100% de las llamadas para comprobar si se siguieron los SOP, si el cliente mostró frustración o si hubo algún fallo. Las evaluaciones fallidas se revisan manualmente. Se auditan muestras aleatorias a diario. Así el equipo se anticipa a los problemas.

7.Escala por etapas.El despliegue de nuevos agentes sigue una progresión del 5%, 10%, 20%, 50% y 100%, con pausas de dos días en cada fase para confirmar que las métricas de evaluación son estables antes de avanzar.

8.No llames a clientes que no han pedido que les contactes. Todas las llamadas salientes de Cars24 van a personas que ya han entrado en el embudo. Contactar con IA sin que lo hayan solicitado aumenta las quejas y daña la confianza. La regla es simple: si no están implicados, no se les llama.

9.Sé transparente si el cliente pregunta si habla con una IA. Los agentes de Cars24 confirman que son asistentes virtuales si se les pregunta. Si el cliente quiere hablar con una persona, la llamada se transfiere de inmediato.

Ver la sesión completaConsidera el gasto en IA como una inversión, no como un coste.Cars24 incluye ahora el gasto en IA en sus planes operativos anuales, con objetivos concretos ligados a resultados de negocio medibles. Cada despliegue debe mover una métrica real.

Ver la sesión completa

Ver la sesión completa

cars-24-bta

Mira el webinar completo bajo demandaaquí.

Descubre artículos del equipo de ElevenLabs

Crea con el audio IA de la más alta calidad