.webp&w=3840&q=95)
Workshop-Rückblick: Eine komplette Marketingkampagne mit KI erstellen
So erstellen Sie eine vollständige Marketingkampagne von Grund auf – inklusive Video, Voiceover, Musik und Soundeffekten.
Cars24setzt produktive Voice-Agents in 13 Sprachen im großen Maßstab ein.
Warum KI-SDR-Agenten relevant sindBehind the Agent: Wie Cars24 über 3 Millionen Minuten Verkaufsgespräche mit Voice-KI automatisiert zusammen. Jayesh Gupta, Head of AI and Innovation bei Cars24, erklärt Schritt für Schritt, wie Cars24 sein Voice-KI-System aufgebaut und eingeführt hat – vom ersten einfachen Anwendungsfall bis zur Multi-Agent-Architektur, die Millionen von Kundengesprächen abwickelt.
Kreative Produktion ist langsam, weil sie fragmentiert ist.
Bis eine Anzeige freigegeben ist, ist der Moment oft schon vorbei.
ElevenCreative wurde entwickelt, um diesen Zyklus zu verkürzen.
75 % der Käufer sind Erstwagenbesitzer. Für diese Kunden ist der Autokauf keine bloße Transaktion, sondern eine finanziell bedeutende, emotionale Entscheidung. Das bedeutet: 70–80 % des Cars24-Produkts ist nicht die App, sondern das Gespräch. Menschliche, geführte und unterstützte Beratung in jeder Phase des Funnels.
Demo 1: Der KI-SDR im Einsatz
Szenario:
Gezeigt wurde:
Warum das relevant ist:
- 25 % des gesamten Anrufvolumens sind automatisiert
- Fast die Hälfte der Verkäufe wird durch Voice-KI unterstützt
- Anrufkosten sind um 50 % gesunken
Workflows
Analyse und Datenerfassung Ein Voice-Agent von Cars24 ruft einen Verkäufer an, der überlegt, sein Auto zu verkaufen, und verhandelt auf Hindi, um ihn von Cars24 gegenüber anderen Plattformen zu überzeugen.
Best Practices
Demo 3: Stimmendesign und Stimmbibliothek
Sehen Sie die komplette Session
Sehen Sie die komplette Session
Szenario:
Warum das relevant ist:Diese Agents führen aktive Verkaufsgespräche, gehen mit Unsicherheiten um, reagieren auf Einwände und führen zur Abschlussentscheidung – und das in der Sprache, in der sich der Kunde am wohlsten fühlt. Cars24 hat festgestellt, dass die Sprachübereinstimmung die Gesprächsdauer und die Geschäftsergebnisse direkt verbessert.
Warum das wichtig ist:
Szenario:Einen individuellen Soundeffekt generieren und den neu gestarteten ElevenMusic-Marktplatz für kommerziell lizenzierte Tracks erkunden.
Gezeigt wurde:
Warum das wichtig ist:
- Sneha fragt gezielt nach: Möchte der Verkäufer upgraden oder verkauft er aus finanziellen Gründen?
Best Practices für die Arbeit mit Flows
- Sneha bietet die Weiterleitung an das richtige Team an und führt diese während des Gesprächs durch
Sehen Sie die komplette Session
Sehen Sie die komplette Session
Warum das relevant ist:Diese Demo zeigt, wie Multi-Agent-Orchestrierung praktisch funktioniert. Jeder Agent übernimmt eine Aufgabe, der Kontext wird weitergegeben. Es gibt keine Wiederholungen oder verlorene Übergaben. Cars24 arbeitet auf eine zentrale 24/7-Nummer hin, über die Kunden ihren gesamten Prozess – Verkauf, Kauf, Finanzierung – ohne Wiederholungen steuern können.
Wie Cars24 das umgesetzt hat: Technische Überlegungen
Cars24 begann mit dem einfachsten Anwendungsfall: Erinnerungen an verpasste Termine. Kurze Anrufe, binäre Ergebnisse, geringe Fehlerkosten. So konnten sie lernen, was funktioniert, bevor sie ausweiteten.
Bei längeren, komplexeren eingehenden Anrufen – etwa Autoberatungsgesprächen mit durchschnittlich 7 Minuten, teils bis zu 13 Minuten – stieß die Single-Agent-Architektur an ihre Grenzen.
Mini-Modelle verloren nach 3 bis 4 Minuten den Kontext.
Größere Modelle führten zu mehr Latenz.
Alles in einen Prompt zu packen, machte das System anfällig: Eine Änderung im Kreditprozess konnte den Kaufprozess stören.
Die Lösung war Multi-Agent-Orchestrierung. Das Gespräch wurde in Phasen unterteilt:
- Ein kleiner Qualifizierungsagent mit Mini-Modell erfasst die erste Absicht
- Ein größeres Modell übernimmt die Beratung, sobald der Kunde engagiert ist und etwas längere Wartezeiten akzeptiert
- Ein dritter, kreditfokussierter Agent wird nur aktiviert, wenn Preis oder Finanzierung relevant werden.
Jeder Agent macht eine Sache gut. Änderungen an einem Agenten beeinträchtigen die anderen nicht.
Der eingesetzte Stack (orchestriert mit der ElevenAgents-Plattform):
- Speech-to-Text: ElevenLabs Scribe v2 Echtzeit, gewählt wegen der Genauigkeit in lauten Tier-2- und Tier-3-Umgebungen in 13 Sprachen
- Text-to-Speech: ElevenLabs Flash 2.5, kürzlich auf V3 Expressive Mode aktualisiert, mit messbarem Anstieg der Verkaufsleistung
- LLM: GPT-4.1 mini für die meisten Anwendungsfälle, GPT-4o oder vergleichbar für längere Beratungsgespräche mit mehr Tiefe
- Telefonie: WebSockets mit PCM bei 24 kHz für Audioqualität; Anbieter sind u.a. Twilio, Exotel und Plivo in Indien
- Integrationen: Individuelle API-Calls in die ElevenLabs Agents-Plattform, MCP-Support und native HubSpot-Integration für Australien
- Vektor-Datenbank: Qdrant, mit binärer Quantisierung für große Datensätze über eine Million Vektoren, um Latenz und Kosten niedrig zu halten
Die Entscheidung für ElevenLabs Agents statt einzelner STT-, LLM- und TTS-Komponenten fiel aus einem Grund: Latenz.
Der Eigenbau der Pipeline, selbst mit denselben Modellen, führte konstant zu Latenzen über einer Sekunde.
Best Practices von Cars24
Best Practices von Cars24
1. Starten Sie dort, wo Fehler am wenigsten kosten.Der erste Anwendungsfall von Cars24 waren Erinnerungen an verpasste Termine – kurz, einfach, risikoarm. Der Erfolg dort schuf intern Glaubwürdigkeit und gab dem Team Raum zum Lernen, bevor wertvollere Funnel-Abschnitte automatisiert wurden.
2.Testen Sie mit echten Kunden, nicht nur mit Simulationen.Interne Tests können die Realität echter Gespräche nicht abbilden. Cars24 testete mit 10 % des Live-Traffics, akzeptierte einen temporären Rückgang und nutzte echtes Feedback für Verbesserungen.
3. Setzen Sie die Prompt-Länge als harte Grenze. Cars24 begrenzt Prompts auf 4.000 bis 5.000 Tokens für Anrufe unter zwei Minuten. Längere Prompts verlangsamen das Modell und verbessern die Ergebnisse nicht zuverlässig. Wenn mehr nötig ist, wird ein weiterer Agent gebaut.
4.Halten Sie häufige Antworten im Prompt, nicht in der Wissensdatenbank.Für die wichtigsten Kundenfragen gehören die Antworten direkt in den Prompt. Tool-Calls und RAG-Retrieval werden für die restlichen 20 % genutzt. Das verhindert die meisten Latenzspitzen bei Wissensabfragen.
5.Nehmen Sie die erste Nachricht vorab auf.ElevenLabs Agents können die Eröffnungsnachricht vorab generieren und zwischenspeichern, bevor der Anruf verbunden wird. In Kombination mit einer nicht unterbrechbaren ersten Nachricht reduziert das frühe Abbrüche durch Netzwerklatenz oder Unterbrechungen.
6.Bauen Sie Evaluation in jeden Anruf ein.Cars24 nutzt ElevenLabs Agents Evals bei 100 % der Anrufe, um zu prüfen, ob SOPs eingehalten wurden, ob der Kunde Frustration zeigte und ob Fehler auftraten. Fehlgeschlagene Evals lösen eine manuelle Prüfung aus. Zufallsstichproben werden täglich auditiert. Das Team bleibt so proaktiv.
7.Skalieren Sie schrittweise.Neue Agent-Deployments erfolgen mit 5 %, 10 %, 20 %, 50 %, 100 % Rollout, jeweils mit zweitägiger Pause, um stabile Eval-Metriken zu bestätigen, bevor weiter ausgerollt wird.
8.Rufen Sie keine Kunden an, die nicht kontaktiert werden möchten. Jeder ausgehende Anruf von Cars24 geht an jemanden, der bereits im Funnel ist. Ungefragte KI-Kontakte erhöhen Beschwerden und schaden dem Vertrauen. Die Regel ist einfach: Wer nicht engagiert ist, wird nicht angerufen.
9.Seien Sie ehrlich, wenn Kunden fragen, ob sie mit KI sprechen. Cars24-Agents bestätigen auf Nachfrage, dass sie virtuelle Assistenten sind. Möchte ein Kunde einen Menschen, wird sofort weitergeleitet.
Sehen Sie die komplette SessionBehandeln Sie KI-Ausgaben als Investition, nicht als Kosten.Cars24 plant KI-Kosten jetzt fest im Jahresbudget ein, mit klaren Zielen und messbaren Geschäftsergebnissen. Jeder Einsatz soll einen echten Wertbeitrag leisten.
Sehen Sie die komplette Session
Komplette Session ansehen
.webp&w=3840&q=95)
Das vollständige Webinar auf Abruf ansehenhier.



.webp&w=3840&q=95)
