Resumo do Webinar: Como a Cars24 Automatiza Mais de 3 Milhões de Minutos em Ligações de Vendas com Voz IA

cars-24-bta-cover

Cars24está operando agentes de voz em escala, em 13 idiomas diferentes.

Este post resume Por Trás do Agente: Como a Cars24 Automatiza Mais de 3 Milhões de Minutos em Ligações de Vendas com Voz IA com Jayesh Gupta, Head de IA e Inovação da Cars24, que explicou em detalhes como a Cars24 construiu e implementou seu sistema de voz IA — desde o primeiro caso de uso simples até uma arquitetura com múltiplos agentes, lidando com milhões de minutos de conversas com clientes.

Por que voz IA em grande escala faz diferença

A Cars24 é um dos maiores marketplaces de carros usados da Índia, com operações na Índia, Emirados Árabes Unidos e Austrália. Eles vendem de 4.000 a 4.500 carros por mês, realizam mais de 100.000 inspeções e facilitam mais de 22.000 test drives.

E isso sem contar financiamento, suporte pós-venda, pagamentos de multas e empréstimos com garantia de veículo. Só o funil de vendas dura de 30 a 45 dias por cliente.

75% dos compradores são pessoas adquirindo o primeiro carro. Para esses clientes, comprar um carro não é só uma transação. É uma decisão importante financeiramente e carregada de emoção. Ou seja, 70 a 80% do produto Cars24 não é o app. É a conversa. Vendas humanas, guiadas e assistidas em todas as etapas do funil.

Antes dos agentes de IA, o sistema estava ficando lento. Clientes ligavam para equipes erradas — o time de vendas era acionado para casos de suporte, aumentando o tempo de espera e tornando a experiência menos eficiente.

Os tempos de espera estavam aumentando. Os retornos de contato eram esquecidos ao longo do funil de 30 dias.

Gerenciar tudo, desde qualificação de leads até documentação de empréstimos, era caro e difícil de escalar.

Hoje:

  1. 25% de todo o volume de ligações é automatizado
  2. Quase metade das vendas conta com apoio da voz IA
  3. Os custos com ligações caíram 50%

Demo 1: O agente de negociação da Cars24

Cenário: Um agente de voz da Cars24 liga para um vendedor que está pensando em vender seu carro e negocia em hindi para convencê-lo a escolher a Cars24 em vez de outras plataformas.

O que foi mostrado:

- O agente conduz toda a negociação de vendas em hindi

- Ele lida com objeções e concorre com outras plataformas em tempo real

- A conversa soa natural, com baixa latência e sem pausas robóticas

- O agente consegue fechar com o vendedor e garantir o compromisso com a Cars24 durante a ligação

Por que isso importa:Esses agentes fazem vendas ativas, lidam com situações ambíguas, respondem a objeções e conduzem a decisão de conversão — tudo no idioma em que o cliente se sente mais à vontade. A Cars24 percebeu que falar o idioma do cliente aumenta o tempo de conversa e melhora os resultados do negócio.

Demo 2: Orquestração multiagente para cross-sell

Cenário: Um cliente perdeu um agendamento de inspeção. Um agente de qualificação liga para remarcar, percebe interesse em upgrade e transfere a ligação ao vivo para um agente de vendas, que continua a conversa sem perder o contexto.

O que foi mostrado:

- Agente 1 (Sneha) começa falando sobre o agendamento perdido e faz o reagendamento

- Sneha investiga a intenção: o vendedor está trocando de carro ou vendendo por motivos financeiros?

- O cliente demonstra interesse em upgrade

- Sneha oferece transferir para o time certo e faz isso durante a ligação

- Agente 2 assume com todo o contexto e segue a conversa para a compra de um carro usado

- Quando o cliente pede para ser chamado em uma hora, o agente confirma, recapitula o status do agendamento e encerra a ligação de forma clara

Por que isso importa:Essa demonstração mostra como funciona a orquestração multiagente na prática. Cada agente cuida de uma tarefa e o contexto é passado entre eles. Não há repetição nem perda de informações. A Cars24 está construindo um número único, disponível 24/7, onde o cliente pode resolver tudo — vender, comprar, financiar — sem precisar repetir informações.

Como a Cars24 construiu: considerações técnicas

A Cars24 começou pelo caso de uso mais simples: lembretes de agendamento perdido. Ligações curtas, resultado binário, baixo custo de erro. Isso permitiu aprender o que funciona antes de expandir.

Quando passaram para ligações mais longas e complexas — conversas de descoberta de carros com média de 7 minutos, chegando a 13 em alguns casos — encontraram um limite nas arquiteturas de agente único.

Modelos menores perdiam o contexto após 3 ou 4 minutos de conversa.

Modelos maiores aumentavam a latência.

Colocar tudo em um único prompt deixava o sistema frágil: uma mudança no fluxo de empréstimo podia quebrar o fluxo de compra.

A solução foi a orquestração multiagente. Eles dividiram a conversa em etapas:

  1. Um agente pequeno de qualificação, usando um mini modelo, capta a intenção inicial
  2. Um modelo maior assume a descoberta quando o cliente está engajado e disposto a esperar um pouco mais
  3. Um terceiro agente, focado em empréstimos, é ativado só se surgir preço ou financiamento.

Cada agente faz bem uma tarefa. Mudanças em um não afetam os outros.

A stack escolhida (orquestrada com a plataforma ElevenAgents):

  1. Speech-to-text: ElevenLabs Scribe v2 em tempo real, escolhido pela precisão em ambientes barulhentos de Tier 2 e Tier 3, em 13 idiomas
  2. Text-to-speech: ElevenLabs Flash 2.5, recentemente atualizado para o modo expressivo V3, com aumento comprovado na performance de vendas
  3. LLM: GPT-4.1 mini para a maioria dos casos, com GPT-4o ou equivalente para chamadas de descoberta mais longas que exigem raciocínio mais profundo
  4. Telefonia: WebSockets com PCM a 24kHz para qualidade de áudio; os provedores incluem Twilio, Exotel e Plivo na Índia
  5. Integrações: Chamadas de API personalizadas na plataforma ElevenLabs Agents, suporte a MCP e integração nativa com HubSpot para o mercado australiano
  6. Banco de dados vetorial: Qdrant, usando quantização binária para grandes volumes acima de um milhão de vetores, mantendo baixa latência e custo

A decisão de usar ElevenLabs Agents, em vez de montar componentes STT, LLM e TTS separados, se resumiu a uma coisa: latência.

Construindo o pipeline por conta própria, mesmo com os mesmos modelos, a latência ficava sempre acima de um segundo.

Boas práticas da Cars24

Boas práticas da Cars24

1. Comece onde o custo de erro é menor.O primeiro caso de uso da Cars24 foi lembrete de agendamento perdido — curto, simples, baixo risco. Provar o modelo ali gerou credibilidade interna e deu espaço para aprender antes de avançar para etapas mais valiosas do funil.

2. Teste com clientes reais, não simulações.Testes internos não reproduzem o caos das conversas reais. A Cars24 rodou pilotos com 10% do tráfego ao vivo, aceitou uma queda temporária e usou feedback real para ajustar.

3. Defina o tamanho do prompt como limite rígido. A Cars24 limita prompts a 4.000–5.000 tokens para ligações de até dois minutos. Prompts maiores deixam o modelo mais lento e não melhoram o resultado. Se precisar de mais, crie outro agente.

4. Deixe as respostas comuns no prompt, não na base de conhecimento.Para as perguntas mais frequentes dos clientes, coloque as respostas direto no prompt. Reserve chamadas de ferramentas e RAG para os 20% restantes. Isso elimina a maioria dos picos de latência nas buscas por conhecimento.

5. Grave a primeira mensagem com antecedência.Os ElevenLabs Agents podem pré-gerar e armazenar a mensagem inicial antes da ligação conectar. Junto com a primeira mensagem não interrompível, isso reduz quedas iniciais causadas por atraso de rede ou interrupções prematuras.

6. Inclua avaliação em toda ligação.A Cars24 usa avaliações dos ElevenLabs Agents em 100% das ligações para verificar se os procedimentos foram seguidos, se o cliente demonstrou frustração e se houve falha. Avaliações negativas geram revisão manual. Amostras aleatórias são auditadas diariamente. O time age de forma proativa, não reativa.

7. Escalone em etapas.Novos agentes são lançados em 5%, 10%, 20%, 50% e 100% do tráfego, com dois dias de observação em cada etapa para garantir estabilidade dos indicadores antes de avançar.

8. Não ligue para quem não pediu contato. Toda ligação ativa da Cars24 é feita para quem já entrou no funil. Abordagem não solicitada com IA aumenta reclamações e prejudica a confiança. A regra é simples: se não está engajado, não ligam.

9. Seja transparente quando perguntarem se estão falando com IA. Os agentes da Cars24 confirmam que são assistentes virtuais quando questionados. Se o cliente quiser falar com um humano, a ligação é transferida na hora.

Assista à sessão completaTrate o investimento em IA como linha de investimento, não custo.A Cars24 agora inclui os custos de IA no planejamento anual, com metas ligadas a resultados de negócio mensuráveis. Cada implantação precisa impactar um indicador real.

Assista à sessão completa

Assista à sessão completa

cars-24-bta

Veja o webinar completo sob demandaaqui.

Explore artigos da equipe ElevenLabs

Crie com o áudio de IA da mais alta qualidade