Webinar-Zusammenfassung: Geben Sie Ihrem Text-Chatbot eine menschlich klingende Stimme
- Veröffentlicht
AnhörenArtikel anhören
Chat-Agenten sind heute Standard in Unternehmenssoftware. Die meisten Unternehmen haben einen oder entwickeln gerade einen. Was jedoch noch nicht viele gelöst haben: Was passiert, wenn Nutzer lieber sprechen möchten?
Nana, eine der größten Super-Apps in Saudi-Arabien, hat einen anderen Weg gewählt. InHinter dem Agenten: Wie Nana KI-Agenten einsetzt, um das Kundenerlebnis zu verbessernberichtete Karim Mustafa, Leiter Kundenerlebnis bei Nana, wie das Unternehmen KI-Agenten im Support eingeführt hat – und welche Auswirkungen das auf Team, Kosten und Qualitätswerte hatte.
Die wichtigste Frage für viele Teams ist nicht mehr, ob sie Sprache integrieren, sondern wie – ohne alles Bestehende neu zu bauen.
Im
Warum Sprachintegration schwieriger ist als gedacht
Nana startete 2016 als Pionier für Lebensmittellieferungen in Saudi-Arabien. Über die Jahre wurde daraus eine Super-App für Wäsche, Autowäsche, Essenslieferung und mehr. Mit dem Produkt wuchs auch das Kontaktvolumen. Das Team beschäftigte 54 Support-Agenten im Schichtbetrieb, um die Nachfrage zu bewältigen.
Der Wendepunkt kam, als Nana von FAQ-Bots und einfachen Chat-Flows auf einen echten KI-Frontend-Agenten auf Basis von ElevenLabs umstieg. Der Agent übernimmt Kundengespräche direkt in der Nana-App, löst Probleme, beantwortet Fragen, verfolgt Bestellungen und leitet bei Bedarf weiter. Die Qualität war sofort und konstant hoch.
Die Auswirkungen auf das Geschäft waren deutlich:
- Nana senkte die Supportkosten um 85 %
- Reaktionszeiten sanken auf wenige Sekunden
Technisch funktioniert es, aber die Konversation ist gestört.
Kontext ist die andere Hälfte des Problems. Die Gesprächshistorie bei jedem Schritt an ein LLM zu übergeben, ist notwendig, aber nicht ausreichend. Die gleichen Worte können – je nach Tonfall – Unterschiedliches bedeuten: "Mir geht's gut" mit Erleichterung und "Mir geht's gut" mit Frustration sind im Transkript gleich, aber in der Interaktion verschieden. Ein Sprachsystem, das diese Ebene ignoriert, klingt immer etwas unnatürlich, egal wie stark die einzelnen Modelle sind.
Hinzu kommt der technische Aufwand. Teams, die ihre eigene Sprachsteuerung betreiben, müssen Logik für Gesprächswechsel, Unterbrechungen und Latenz laufend pflegen. Es ist keine einmalige Entwicklung.
KI-Stimmen lösen alle drei Probleme: Sie liefern konsistente Lösungen, passen sich sofort an neue Informationen an und skalieren flexibel auf jedes Volumen.
So fügen Sie einem bestehenden Agenten Sprache hinzu
Der klarste Ansatz ist eine Dual-WebSocket-Architektur.
Karim beschrieb, wie sich die Herangehensweise des Teams verändert hat. Bei neuen Herausforderungen fragt heute niemand mehr, wie viele Leute gebraucht werden, sondern wie schnell ein Agent gebaut werden kann.
Die verbleibenden Support-Mitarbeiter konnten zwischen festen Schichten oder flexiblen Arbeitszeiten mit KI-basierten KPIs wählen. Alle entschieden sich für das flexible Modell.
Urban Company setzt KI-Stimmen in drei großen Bereichen ein:
- Seien Sie multimodal. Nana stellte fest, dass Kunden nicht nur anrufen, sondern auch schreiben wollen. Der passende Kanal zum Kundenverhalten erleichtert die Einführung und beschleunigt Ergebnisse.
- Fokus auf Prompt-Qualität, nicht nur auf Technologie.Die KI spiegelt die Qualität der Anweisungen wider. Das Team von Karim investierte Zeit in Prompts, die dem Agenten Empathie und markengerechte Antworten vermittelten.
- Für arabische Deployments: Tashkeel nutzen.Vokalzeichen im arabischen Prompt-Text verbessern die Aussprache und Natürlichkeit deutlich.
- Menschliche Agenten weiterentwickeln, nicht ersetzen.Das beste Potenzial des Teams liegt darin, die KI zu verbessern – nicht sie zu ersetzen. Geben Sie ihnen Verantwortung für Workflow-Design und Qualitätskontrolle.
- Von Anfang an auf Skalierbarkeit setzen.Sobald der erste Agent live ist, kann die Plattform auch ausgehende Anrufe, interne Workflows, Werbung und abteilungsübergreifende Anwendungsfälle unterstützen. Nana ist jetzt die Abteilung, an die sich andere Teams wenden, wenn ein neues Projekt schnell starten soll.
- Gehen Sie direkt zur Quelle.Mehrere Anbieter, die Nana geprüft hat, haben ElevenLabs mit Aufschlag weiterverkauft. Der direkte Aufbau auf ElevenLabs brachte Zugang zu den neuesten Modellen, geringere Kosten und direkten technischen Support.
Ein
Instahelphier.
.webp&w=3840&q=95)
.jpg&w=3840&q=80)


