Webinar-Zusammenfassung: Wie Cars24 über 3 Millionen Minuten Verkaufsgespräche mit Voice-KI automatisiert

cars-24-bta-cover

Cars24setzt produktive Voice-Agents in 13 Sprachen im großen Maßstab ein.

Dieser Beitrag fasst Behind the Agent: Wie Cars24 über 3 Millionen Minuten Verkaufsgespräche mit Voice-KI automatisiert zusammen. Jayesh Gupta, Head of AI and Innovation bei Cars24, erklärt Schritt für Schritt, wie Cars24 sein Voice-KI-System aufgebaut und eingeführt hat – vom ersten einfachen Anwendungsfall bis zur Multi-Agent-Architektur, die Millionen von Kundengesprächen abwickelt.

Warum Voice-KI in diesem Umfang relevant ist

Cars24 ist einer der größten Gebrauchtwagen-Marktplätze Indiens mit Aktivitäten in Indien, den VAE und Australien. Sie verkaufen 4.000–4.500 Autos pro Monat, führen über 100.000 Inspektionen durch und ermöglichen mehr als 22.000 Probefahrten.

Und das, bevor Finanzierung, After-Sales-Support, Strafzahlungen und Autokredite berücksichtigt werden. Allein der Verkaufsprozess dauert pro Kunde 30 bis 45 Tage.

75 % der Käufer sind Erstwagenbesitzer. Für diese Kunden ist der Autokauf keine bloße Transaktion, sondern eine finanziell bedeutende, emotionale Entscheidung. Das bedeutet: 70–80 % des Cars24-Produkts ist nicht die App, sondern das Gespräch. Menschliche, geführte und unterstützte Beratung in jeder Phase des Funnels.

Vor den KI-Agents wurde das System langsamer. Kunden riefen die falschen Teams an – das Verkaufsteam wurde für Support-Anfragen kontaktiert, was zu längeren Wartezeiten und einer ineffizienten Customer Experience führte.

Die Wartezeiten wurden länger. Rückrufe wurden im 30-Tage-Funnel übersehen.

Die Abwicklung von Lead-Qualifizierung bis zur Kreditdokumentation war teuer und schwer skalierbar.

Heute:

  1. 25 % des gesamten Anrufvolumens sind automatisiert
  2. Fast die Hälfte der Verkäufe wird durch Voice-KI unterstützt
  3. Anrufkosten sind um 50 % gesunken

Demo 1: Der Verhandlungsagent von Cars24

Szenario: Ein Voice-Agent von Cars24 ruft einen Verkäufer an, der überlegt, sein Auto zu verkaufen, und verhandelt auf Hindi, um ihn von Cars24 gegenüber anderen Plattformen zu überzeugen.

Gezeigt wurde:

- Der Agent führt eine vollständige Verkaufsverhandlung auf Hindi

- Er geht auf Einwände ein und konkurriert in Echtzeit mit anderen Plattformen

- Das Gespräch klingt natürlich, mit geringer Latenz und ohne robotische Pausen

- Der Agent überzeugt den Verkäufer während des Gesprächs, sich für Cars24 zu entscheiden

Warum das relevant ist:Diese Agents führen aktive Verkaufsgespräche, gehen mit Unsicherheiten um, reagieren auf Einwände und führen zur Abschlussentscheidung – und das in der Sprache, in der sich der Kunde am wohlsten fühlt. Cars24 hat festgestellt, dass die Sprachübereinstimmung die Gesprächsdauer und die Geschäftsergebnisse direkt verbessert.

Demo 2: Multi-Agent-Orchestrierung für Cross-Selling

Szenario: Ein Kunde hat einen Inspektionstermin verpasst. Ein Qualifizierungsagent ruft an, um einen neuen Termin zu vereinbaren, erkennt Upgrade-Absichten und leitet das Gespräch live an einen Verkaufsagenten weiter, der ohne Informationsverlust übernimmt.

Gezeigt wurde:

- Agentin 1 (Sneha) spricht den verpassten Termin an und vereinbart einen neuen

- Sneha fragt gezielt nach: Möchte der Verkäufer upgraden oder verkauft er aus finanziellen Gründen?

- Der Kunde signalisiert Upgrade-Absicht

- Sneha bietet die Weiterleitung an das richtige Team an und führt diese während des Gesprächs durch

- Agent 2 übernimmt mit vollem Kontext und führt das Gespräch zum Gebrauchtwagenkauf weiter

- Wenn der Kunde um einen Rückruf in einer Stunde bittet, bestätigt der Agent, fasst den Terminstatus zusammen und beendet das Gespräch sauber

Warum das relevant ist:Diese Demo zeigt, wie Multi-Agent-Orchestrierung praktisch funktioniert. Jeder Agent übernimmt eine Aufgabe, der Kontext wird weitergegeben. Es gibt keine Wiederholungen oder verlorene Übergaben. Cars24 arbeitet auf eine zentrale 24/7-Nummer hin, über die Kunden ihren gesamten Prozess – Verkauf, Kauf, Finanzierung – ohne Wiederholungen steuern können.

Wie Cars24 das umgesetzt hat: Technische Überlegungen

Cars24 begann mit dem einfachsten Anwendungsfall: Erinnerungen an verpasste Termine. Kurze Anrufe, binäre Ergebnisse, geringe Fehlerkosten. So konnten sie lernen, was funktioniert, bevor sie ausweiteten.

Bei längeren, komplexeren eingehenden Anrufen – etwa Autoberatungsgesprächen mit durchschnittlich 7 Minuten, teils bis zu 13 Minuten – stieß die Single-Agent-Architektur an ihre Grenzen.

Mini-Modelle verloren nach 3 bis 4 Minuten den Kontext.

Größere Modelle führten zu mehr Latenz.

Alles in einen Prompt zu packen, machte das System anfällig: Eine Änderung im Kreditprozess konnte den Kaufprozess stören.

Die Lösung war Multi-Agent-Orchestrierung. Das Gespräch wurde in Phasen unterteilt:

  1. Ein kleiner Qualifizierungsagent mit Mini-Modell erfasst die erste Absicht
  2. Ein größeres Modell übernimmt die Beratung, sobald der Kunde engagiert ist und etwas längere Wartezeiten akzeptiert
  3. Ein dritter, kreditfokussierter Agent wird nur aktiviert, wenn Preis oder Finanzierung relevant werden.

Jeder Agent macht eine Sache gut. Änderungen an einem Agenten beeinträchtigen die anderen nicht.

Der eingesetzte Stack (orchestriert mit der ElevenAgents-Plattform):

  1. Speech-to-Text: ElevenLabs Scribe v2 Echtzeit, gewählt wegen der Genauigkeit in lauten Tier-2- und Tier-3-Umgebungen in 13 Sprachen
  2. Text-to-Speech: ElevenLabs Flash 2.5, kürzlich auf V3 Expressive Mode aktualisiert, mit messbarem Anstieg der Verkaufsleistung
  3. LLM: GPT-4.1 mini für die meisten Anwendungsfälle, GPT-4o oder vergleichbar für längere Beratungsgespräche mit mehr Tiefe
  4. Telefonie: WebSockets mit PCM bei 24 kHz für Audioqualität; Anbieter sind u.a. Twilio, Exotel und Plivo in Indien
  5. Integrationen: Individuelle API-Calls in die ElevenLabs Agents-Plattform, MCP-Support und native HubSpot-Integration für Australien
  6. Vektor-Datenbank: Qdrant, mit binärer Quantisierung für große Datensätze über eine Million Vektoren, um Latenz und Kosten niedrig zu halten

Die Entscheidung für ElevenLabs Agents statt einzelner STT-, LLM- und TTS-Komponenten fiel aus einem Grund: Latenz.

Der Eigenbau der Pipeline, selbst mit denselben Modellen, führte konstant zu Latenzen über einer Sekunde.

Best Practices von Cars24

Best Practices von Cars24

1. Starten Sie dort, wo Fehler am wenigsten kosten.Der erste Anwendungsfall von Cars24 waren Erinnerungen an verpasste Termine – kurz, einfach, risikoarm. Der Erfolg dort schuf intern Glaubwürdigkeit und gab dem Team Raum zum Lernen, bevor wertvollere Funnel-Abschnitte automatisiert wurden.

2.Testen Sie mit echten Kunden, nicht nur mit Simulationen.Interne Tests können die Realität echter Gespräche nicht abbilden. Cars24 testete mit 10 % des Live-Traffics, akzeptierte einen temporären Rückgang und nutzte echtes Feedback für Verbesserungen.

3. Setzen Sie die Prompt-Länge als harte Grenze. Cars24 begrenzt Prompts auf 4.000 bis 5.000 Tokens für Anrufe unter zwei Minuten. Längere Prompts verlangsamen das Modell und verbessern die Ergebnisse nicht zuverlässig. Wenn mehr nötig ist, wird ein weiterer Agent gebaut.

4.Halten Sie häufige Antworten im Prompt, nicht in der Wissensdatenbank.Für die wichtigsten Kundenfragen gehören die Antworten direkt in den Prompt. Tool-Calls und RAG-Retrieval werden für die restlichen 20 % genutzt. Das verhindert die meisten Latenzspitzen bei Wissensabfragen.

5.Nehmen Sie die erste Nachricht vorab auf.ElevenLabs Agents können die Eröffnungsnachricht vorab generieren und zwischenspeichern, bevor der Anruf verbunden wird. In Kombination mit einer nicht unterbrechbaren ersten Nachricht reduziert das frühe Abbrüche durch Netzwerklatenz oder Unterbrechungen.

6.Bauen Sie Evaluation in jeden Anruf ein.Cars24 nutzt ElevenLabs Agents Evals bei 100 % der Anrufe, um zu prüfen, ob SOPs eingehalten wurden, ob der Kunde Frustration zeigte und ob Fehler auftraten. Fehlgeschlagene Evals lösen eine manuelle Prüfung aus. Zufallsstichproben werden täglich auditiert. Das Team bleibt so proaktiv.

7.Skalieren Sie schrittweise.Neue Agent-Deployments erfolgen mit 5 %, 10 %, 20 %, 50 %, 100 % Rollout, jeweils mit zweitägiger Pause, um stabile Eval-Metriken zu bestätigen, bevor weiter ausgerollt wird.

8.Rufen Sie keine Kunden an, die nicht kontaktiert werden möchten. Jeder ausgehende Anruf von Cars24 geht an jemanden, der bereits im Funnel ist. Ungefragte KI-Kontakte erhöhen Beschwerden und schaden dem Vertrauen. Die Regel ist einfach: Wer nicht engagiert ist, wird nicht angerufen.

9.Seien Sie ehrlich, wenn Kunden fragen, ob sie mit KI sprechen. Cars24-Agents bestätigen auf Nachfrage, dass sie virtuelle Assistenten sind. Möchte ein Kunde einen Menschen, wird sofort weitergeleitet.

Sehen Sie die komplette SessionBehandeln Sie KI-Ausgaben als Investition, nicht als Kosten.Cars24 plant KI-Kosten jetzt fest im Jahresbudget ein, mit klaren Zielen und messbaren Geschäftsergebnissen. Jeder Einsatz soll einen echten Wertbeitrag leisten.

Komplette Session ansehen

Komplette Session ansehen

cars-24-bta

Das vollständige Webinar auf Abruf ansehenhier.

Entdecken Sie Artikel des ElevenLabs-Teams

Erstellen Sie mit hochwertiger KI-Audio