Direkt zum Inhalt

Der Stand der Conversational KI im Support

Conversational KI macht Support günstiger und besser skalierbar

Over-ear headphones with sound wave graphics on a dark blue background.

Stripe steht für exzellenten Support und geht oft einen Schritt weiter, um zu überraschen. Doch großartiger Support ist mehr als handgeschriebene Notizen oder 3D-gedruckte Figuren auf Twitter. Über ein Jahrzehnt an menschlicher und technischer Entwicklung hat Stripe ermöglicht, einen Kundenservice zu bieten, der jährlich Millionen Unternehmen unterstützt. Ich kam 2015 zu Stripe, als das Unternehmen gerade 200 Mitarbeitende hatte und das Support-Team an einen Konferenztisch passte.

Ich war eine der ersten Einstellungen in Dublin, einem frühen Standort für Stripes globalen Support. In meinen fünf Jahren dort wurde das Support-Team spezialisiert, externe Anbieter als Tier-1-Support eingeführt, Kanäle und Sprachen erweitert und schließlich kostenpflichtige Support-Pläne angeboten. Ich habe diese Programme mitgestaltet und getestet und dabei die Herausforderungen beim Skalieren von Kundenservice erlebt – Herausforderungen, die Conversational KI deutlich vereinfachen könnte.

Conversational KI
Conversational AI Diagram

Conversational KI besteht aus drei Elementen, die nahtlos zusammenarbeiten: Speech-to-Text erfasst die Nutzerabsicht, Sprachmodelle interpretieren und generieren intelligente Antworten, und Text-to-Speech wandelt diese Antworten in natürliche Sprache um.

  • Speech to Text: Die KI-„Ohren“ wandeln gesprochene Sprache präzise in Text um.
  • Sprachmodelle: Das KI-„Gehirn“ verarbeitet den Text, versteht den Kontext und generiert passende Antworten.
  • Text to Speech: Die Stimme wandelt Text in natürlich klingende Sprache um.
  • Turn Taking: Ein eigener Dienst erkennt Unterbrechungen und sorgt für einen natürlichen Gesprächsfluss.

Als ich bei Stripe anfing, bestand meine Aufgabe darin, das Produkt so umfassend wie möglich kennenzulernen. Im Training habe ich erfahrene Kolleginnen und Kollegen begleitet und aus vielen früheren Supportfällen gelernt – ähnlich wie ein KI-Agent lernen würde.

KI ist stark in der Mustererkennung – und Support ist oft genau das. Ein Nutzer schildert sein Problem, der Support-Agent gleicht es mit seinem Wissen ab und gibt eine Antwort. Doch Support ist mehr als das Wiedergeben einer Wissensdatenbank: Guter Kundenservice braucht Empathie, Kreativität und Zusammenarbeit mit dem Nutzer. Leider fehlt das in den meisten Supportfällen.

Der Status quo im Support

Support ist ein wichtiger Kontaktpunkt, aber oft frustrierend. Denken Sie an Ihren letzten Anruf bei einer Airline: Sie warten stundenlang, nur um dann zu hören, dass Ihr Anliegen eine andere Abteilung betrifft – und das Spiel beginnt von vorn.

Nicht nur für Kunden ist das mühsam. Hochwertigen Support zu bieten ist schwierig – und im großen Maßstab noch schwieriger. In unserer softwaregetriebenen Welt sind Support-Prozesse oft durch physische Ressourcen begrenzt. Kommen über Nacht viele neue Kunden, können Sie einfach eine AWS-Instanz hochfahren – aber Support lässt sich nicht einfach per Knopfdruck skalieren.

Support lässt sich nur mit Zeit und Geld ausbauen. In Nordamerika kostet es etwa 12.000 US-Dollar, einen Support-Agenten zu finden, auszubilden und einzuarbeiten. Mit diesen Anfangskosten liegt der durchschnittliche Stundensatz bei 30 bis 40 US-Dollar. Manche Unternehmen lagern Support aus – zu Stundensätzen von 8 bis 30 US-Dollar. Das klingt attraktiv, bringt aber Kontrollverlust bei Qualität, Prozessen und Verantwortlichkeit mit sich.

Was wäre, wenn Sie Support in wenigen Minuten starten und beliebig skalieren könnten? Was, wenn Sie hochwertigen Support zu geringen Kosten hätten? Das ist das Versprechen von Conversational KI. Nach Jahren im Support bin ich überzeugt: Das verändert alles.Konversationelle KI, und nachdem ich jahrelang im Support gearbeitet habe, bin ich davon überzeugt, dass es eine völlige Wende bedeutet.

Alexis ist ein Beispiel für einen KI-Agenten von ElevenLabs. Er wurde als Support-Agent entwickelt innerhalb der ElevenLabs-Dokumentation und bearbeitet inzwischen über hundert Anfragen pro Tag.

Stellen Sie sich vor, Alexis wäre ein Mensch. Ich glaube nicht, dass viele menschliche Support-Agenten 100 Anrufe am Tag schaffen. Ein sehr effizienter Agent mit einfachen Fällen schafft vielleicht 60, weniger erfahrene oder bei komplexeren Anfragen eher 40. Sie müssten also mindestens zwei Personen einstellen und vermutlich Überstunden bezahlen.

Wären die Agenten in Nordamerika, würden 100 Anrufe mindestens 700 US-Dollar kosten, im Schnitt etwa 1.719 US-Dollar, maximal bis zu 4.094 US-Dollar. Das ist viel – daher lagern viele Unternehmen aus. Dann liegen die Kosten zwischen 128 und 480 US-Dollar, im Schnitt 288 US-Dollar. Das klingt günstiger, aber es gibt versteckte Kosten für Einarbeitung und Kontrolle der Dienstleister – und Risiken für Marke und Reputation, wenn die Qualität nicht stimmt.

Methode Min. Ø Max.
Mensch (intern) 1,40 3,44 8,19
Mensch (ausgelagert) 0,256 0,576 0,96
KI 0,026 0,031 0,036
Quelle: thinkhdi.com

Die Kosten für einen KI-Support-Agenten liegen beim Audioteil bei nur 0,015 US-Dollar pro Minute. Das Sprachmodell kostet je nach Modell und Wissensbasis weniger als einen Cent bis wenige Cent pro Minute. Für hundert Anrufe wären das etwa 13 bis 18 US-Dollar. Das ist über 110-mal günstiger als ein interner Agent und 18-mal günstiger als ein ausgelagerter. Als objektive Support-Erfahrung ist Alexis sehr gut. Zu diesem Preis ist er unschlagbar.

Conversational KI im Einsatz

In der weitgehend analogen Welt der Lieferketten ist Traba eine technologische Brücke für Talente und hilft Industrieunternehmen, ihre Mitarbeitenden zu finden und zu verwalten. Traba bietet Apps und Dashboards, aber Telefonate bleiben ein zentrales Bindeglied für eine Belegschaft, die Papier-Stundenzettel und Pinnwände gewohnt ist.

Traba hat analysiert, womit das Operationsteam am meisten Zeit am Telefon verbringt: Supportanfragen und Checklisten für die Einsatzplanung. Für CTO Akshay Buddiga war Automatisierung die logische Lösung – aber auch das Timing ist entscheidend. „Wenn wir einen Prozess effizienter machen wollen, setzen wir Automatisierung früh ein, statt später nachzurüsten.“

Traba achtet stark auf die Stückkosten und will technologisch vorne bleiben. Daher war der Wechsel zu Conversational KI aus mehreren Gründen attraktiv. Geschwindigkeit und Kosten waren wichtig, aber auch die Nutzererfahrung. Softwareentwickler Joseph Besgen sagt: „Wir wollten, dass es wie ein echtes Gespräch klingt, nicht wie eine Aufnahme.“ Das ElevenLabs-Demo klang so real, dass ein Traba-Mitarbeiter im Test seinen Vater nicht überzeugen konnte, ob er mit einer KI oder einem Teammitglied sprach.

Obwohl die Einsatzplanung für Tausende Industriearbeiter komplex ist, sollte es nicht so schwer sein, einen einzigen Arzttermin zu vereinbaren. Aber haben Sie kürzlich versucht, Ihren Arzt anzurufen? Für Patienten ist das frustrierend und für das Personal ineffizient. Gemeinsam mit ElevenLabs sorgt EliseAI dafür, dass Assistenten Aufgaben in der Gesundheitsverwaltung übernehmen – von Terminvereinbarungen bis zur Abrechnung. In einem Krankenhaus werden inzwischen 86 % der Anrufe vollständig von

Die Zukunft

Graph showing state of Conversational AI across industry sectors

Betrachtet man das Wachstum von Conversational KI nach Branchen, zeigen sich interessante Trends. EdTech war die erste Branche, die Conversational KI einsetzte – Unternehmen konnten erstmals individuelle Nachhilfe und Sprachtraining zu bezahlbaren Preisen anbieten. Schnell folgten Support-Anwendungen, da Supportfälle besonders gut für Mustererkennung geeignet sind: Die Antwort steht in einer Wissensdatenbank, und der KI-Agent gleicht sie mit der Nutzerfrage ab. Wir sehen auch mehr spezialisierte End-to-End-Lösungen, etwa in Logistik und Gesundheitswesen – wie bei Traba und EliseAI. Auch hier sind die Aufgaben repetitiv und vorhersehbar, also gut für KI-Agenten geeignet.

Konversationelle KI bringt Unterstützung aus dem atomaren Bereich in die Welt der Bits. Jetzt kann der Support für Unternehmen und ihre Kunden zu einem besseren Erlebnis werden. Wie Ihr Cloud-Anbieter kann Ihr KI-Supportteam nach oben und unten skaliert werden. Ihre Kunden müssen nie in der Warteschleife warten und Sie ersparen sich den operativen Aufwand, Support-Center auf der ganzen Welt einzurichten.

Im letzten Jahr waren Voice-Agenten gut in Konversation und Wissensabruf – aber das ist erst der Anfang. 2025 werden KI-Voice-Agenten der Standard für Terminvereinbarungen und Supportanfragen zu Produkten sein. Auch wenn sie sich auf Wissensabruf beschränken, wird das das Supportvolumen deutlich senken und menschliche Teams für wertvollere Aufgaben freisetzen.

2026 werden KI-Voice-Agenten nicht nur Wissen abrufen, sondern auch Aktionen ausführen. Sie werden API-Aufrufe machen und sich mit Drittanbieter-Apps verbinden. Routinetätigkeiten wie Terminbuchungen oder Rückerstattungen werden sie selbstständig übernehmen.

2027 werden KI-Voice-Agenten vom Support zum Customer Success übergehen. Ich glaube, dass komplette Verkaufsprozesse von KI-Agenten abgewickelt werden – auf Käufer- und Verkäuferseite. Für viele klingt das wie die letzte Grenze, aber ich denke, es ist erst der Anfang. Aufgaben, die wir für rein menschlich hielten – kontextbezogen und kreativ – werden zunehmend von KI übernommen.

Support wird sich vom Kostenfaktor zum Profitcenter wandeln. KI-Voice-Agenten werden proaktiv Kunden ansprechen, Abwanderung reduzieren und den Kundenwert steigern. Conversational KI bietet viele Vorteile menschlichen Supports – mit perfektem Gedächtnis, in Dutzenden Sprachen und rund um die Uhr. Die Zukunft kommt – und in vielem ist sie schon da. Stellen Sie sich vor: Sofortiger, empathischer, effektiver Support – jedes Mal. Bald werden Sie fast Lust haben, bei einer Airline anzurufen, einfach so.

Entdecken Sie Artikel des ElevenLabs-Teams

Erstellen Sie mit hochwertiger KI-Audio