Salta al contenido

Resumen del workshop: Cómo crear un SDR IA en 45 minutos

Crea un agente SDR IA que califica leads y agenda reuniones

ai-sdr-workshop

Cars24utiliza agentes de voz en producción a gran escala en 13 idiomas.

Por qué importan los agentes SDR IADetrás del agente: Cómo Cars24 automatiza más de 3 millones de minutos de llamadas de ventas con voz IA con Jayesh Gupta, Head of AI and Innovation en Cars24, que explicó paso a paso cómo crearon y desplegaron su sistema de voz IA: desde el primer caso de uso sencillo hasta una arquitectura multiagente que gestiona millones de minutos de conversaciones con clientes.

Algunos de los retos eran:

Automatizar este proceso se convirtió en una decisión clara.

El agente SDR IA funciona 24/7, gestiona más de 70 idiomas, califica oportunidades según criterios definidos y agenda reuniones directamente en el calendario durante la llamada. Sin esperas. Sin problemas de husos horarios.

El 75% de sus compradores adquiere su primer coche. Para estos clientes, comprar un coche no es solo una transacción: es una decisión importante a nivel económico y emocional. Por eso, el 70-80% del producto Cars24 no es la app, es la conversación. Ventas humanas, guiadas y asistidas en cada etapa del proceso.

Demo 1: El SDR IA en acción

Los tiempos de espera aumentaban y se perdían seguimientos a lo largo de un embudo de 30 días.

Lo que se mostró:

Por qué es importante:

  1. El 25% del volumen de llamadas está automatizado
  2. Casi la mitad de las ventas cuenta con asistencia de voz IA
  3. El coste de las llamadas ha bajado un 50%

Workflows

Análisis y recogida de datos Un agente de voz de Cars24 llama a un vendedor que está pensando en vender su coche y negocia en hindi para convencerle de elegir Cars24 frente a otras plataformas.

Buenas prácticas

- El agente lleva a cabo toda la negociación de ventas en hindi

Mira la sesión completa

Mira la sesión completa

- El agente consigue que el vendedor se comprometa con Cars24 durante la llamada

Por qué es relevante:Estos agentes hacen ventas activas, gestionan la ambigüedad, responden a objeciones y logran conversiones, todo en el idioma en el que el cliente se siente más cómodo. Cars24 ha comprobado que adaptar el idioma aumenta el tiempo de conversación y mejora los resultados.

Demo 2: Orquestación multiagente para hacer cross-sell

Escenario: Un cliente ha perdido una cita de inspección. Un agente de cualificación llama para reprogramar, detecta intención de mejora y transfiere la llamada en directo a un agente de ventas, que continúa la conversación sin perder el contexto.

Lo que se mostró:

- Agente 1 (Sneha) empieza abordando la cita perdida y la reprograma

- Sneha indaga la intención: ¿el vendedor quiere mejorar su coche o vende por motivos económicos?

- El cliente muestra intención de mejora

- Sneha ofrece transferir la llamada al equipo adecuado y lo hace durante la llamada

- El agente 2 retoma la conversación con todo el contexto y la orienta hacia la compra de un coche de segunda mano

- Cuando el cliente pide que le llamen en una hora, el agente lo confirma, repasa el estado de la cita y termina la llamada correctamente

Por qué es relevante:Esta demo muestra cómo funciona la orquestación multiagente en la práctica. Cada agente se encarga de una tarea y el contexto pasa de uno a otro. No hay repeticiones ni traspasos fallidos. Cars24 avanza hacia un único número 24/7 donde el cliente puede gestionar todo su proceso —vender, comprar, financiar— sin tener que repetirse.

Cómo lo construyó Cars24: consideraciones técnicas

Cars24 empezó con el caso de uso más sencillo: recordatorios de citas perdidas. Llamadas cortas, resultados binarios y bajo riesgo de error. Así aprendieron qué funcionaba antes de ampliar el sistema.

Al pasar a llamadas entrantes más largas y complejas —conversaciones de descubrimiento de coches de unos 7 minutos, a veces hasta 13—, se toparon con el límite de las arquitecturas de agente único.

Los modelos pequeños perdían el contexto a partir de los 3-4 minutos.

Los modelos grandes introducían latencia.

Meterlo todo en un solo prompt hacía el sistema frágil: un cambio en el flujo de préstamos podía romper el de compra.

La solución fue la orquestación multiagente. Dividieron la conversación en etapas:

  1. Un agente pequeño de cualificación con un modelo mini capta la intención inicial
  2. Un modelo más grande toma el relevo para el descubrimiento cuando el cliente está implicado y dispuesto a esperar un poco más
  3. Un tercer agente centrado en préstamos solo se activa si se habla de precio o financiación.

Cada agente hace bien una cosa. Los cambios en uno no afectan a los demás.

La arquitectura final (orquestada con la plataforma ElevenAgents):

  1. Voz a texto: ElevenLabs Scribe v2 en tiempo real, elegida por su precisión en entornos ruidosos de nivel 2 y 3 en 13 idiomas
  2. Texto a voz: ElevenLabs Flash 2.5, recientemente actualizado al modo expresivo V3 con mejora demostrada en ventas
  3. LLM: GPT-4.1 mini para la mayoría de casos, y GPT-4o o equivalente para llamadas de descubrimiento más largas que requieren razonamiento avanzado
  4. Telefonía: WebSockets con PCM a 24kHz para calidad de audio; sus proveedores incluyen Twilio, Exotel y Plivo en India
  5. Integraciones: llamadas API personalizadas en la plataforma ElevenLabs Agents, soporte MCP e integración nativa con HubSpot para el mercado australiano
  6. Base de datos vectorial: Qdrant, usando cuantización binaria para grandes volúmenes (más de un millón de vectores) y así mantener baja la latencia y el coste

La decisión de usar ElevenLabs Agents en vez de montar componentes STT, LLM y TTS por separado se debió a una razón: la latencia.

Construir el pipeline por su cuenta, incluso con los mismos modelos, elevaba la latencia por encima de un segundo.

Buenas prácticas de Cars24

Buenas prácticas de Cars24

1. Empieza donde el coste de fallar sea más bajo.El primer caso de uso de Cars24 fueron los recordatorios de citas perdidas: llamadas cortas, simples y de bajo riesgo. Demostrar el modelo ahí generó credibilidad interna y permitió aprender antes de abordar partes más valiosas del embudo.

2.Hazlo con clientes reales, no simulaciones.Las pruebas internas no replican el caos de las conversaciones reales. Cars24 probó sus pilotos con el 10% del tráfico real, aceptó una bajada temporal y usó el feedback real para iterar.

3. Pon un límite estricto a la longitud del prompt. Cars24 limita los prompts a 4.000-5.000 tokens para llamadas de menos de dos minutos. Prompts más largos ralentizan el modelo y no mejoran los resultados. Si un caso necesita más, crea otro agente.

4.Pon las respuestas habituales en el prompt, no en la base de conocimiento.Para las preguntas más frecuentes de los clientes, pon las respuestas directamente en el prompt. Reserva las llamadas a herramientas y la recuperación RAG para el 20% restante. Así se evitan la mayoría de picos de latencia en búsquedas de información.

5.Pregraba el primer mensaje.ElevenLabs Agents puede pre-generar y guardar el mensaje de apertura antes de conectar la llamada. Si además haces que ese mensaje no se pueda interrumpir, reduces las desconexiones tempranas por lag de red o interrupciones prematuras.

6.Evalúa cada llamada.Cars24 usa las evaluaciones de ElevenLabs Agents en el 100% de las llamadas para comprobar si se siguieron los SOP, si el cliente mostró frustración o si hubo algún fallo. Las evaluaciones fallidas se revisan manualmente. Se auditan muestras aleatorias a diario. Así el equipo se anticipa a los problemas.

7.Escala por etapas.El despliegue de nuevos agentes sigue una progresión del 5%, 10%, 20%, 50% y 100%, con pausas de dos días en cada fase para confirmar que las métricas de evaluación son estables antes de avanzar.

8.No llames a clientes que no han pedido que les contactes. Todas las llamadas salientes de Cars24 van a personas que ya han entrado en el embudo. Contactar con IA sin que lo hayan solicitado aumenta las quejas y daña la confianza. La regla es simple: si no están implicados, no se les llama.

9.Sé transparente si el cliente pregunta si habla con una IA. Los agentes de Cars24 confirman que son asistentes virtuales si se les pregunta. Si el cliente quiere hablar con una persona, la llamada se transfiere de inmediato.

Ver la sesión completaConsidera el gasto en IA como una inversión, no como un coste.Cars24 incluye ahora el gasto en IA en sus planes operativos anuales, con objetivos concretos ligados a resultados de negocio medibles. Cada despliegue debe mover una métrica real.

Mira la sesión completa

Ver la sesión completa

cars-24-bta

Mira el webinar completo bajo demandaaquí.

Descubre artículos del equipo de ElevenLabs

Crea con el audio IA de la más alta calidad