Der aktuelle Stand der Konversations-KI im Support

Konversations-KI kann die Bereitstellung von Support günstiger und skalierbarer machen

Stripe steht für großartigen Support und geht oft noch einen Schritt weiter, um zu überraschen und zu erfreuen. Großartige Unterstützung besteht jedoch aus mehr als nur den handschriftlichen Notizen und 3D-gedruckten Totems, die wir auf Twitter sehen. Durch mehr als ein Jahrzehnt menschlicher und softwaretechnischer Entwicklung konnte Stripe ein Kundenserviceangebot aufbauen, das jährlich Millionen von Unternehmen unterstützt. Ich kam 2015 zu Stripe, als das Unternehmen gerade 200 Leuten Trinkgeld gegeben hatte und das Support-Team an einen Konferenztisch passte.

Ich war einer der ersten Neueinstellungen in Dublin, einer frühen Außenstelle im weltweiten Supportbereich von Stripe. In den fünf Jahren, die ich dort war, hat Stripe das Supportteam nach Spezialisierungen neu organisiert, externe Anbieter als Tier-1-Support eingeführt, Kanäle erweitert, Sprachen hinzugefügt und schließlich kostenpflichtige Supportpläne eingeführt. Durch meine Mitwirkung bei der Entwicklung und Erprobung dieser sich entwickelnden Supportprogramme habe ich aus erster Hand die Komplexität der Skalierung des Kundendienstes erlebt – Komplexitäten, die durch Konversations-KI hätten rationalisiert werden können.

Konversations-KI
Diagramm der Konversations-KI

Konversations-KI besteht aus drei Elementen. Diese drei Elemente arbeiten nahtlos zusammen: Speech-to-Text erfasst die Absicht des Benutzers, Sprachmodelle interpretieren und generieren intelligente Antworten und Text-to-Speech wandelt diese Antworten in eine natürliche Konversation um.

  • Sprache zu Text: Die KI-Ohren wandeln die gesprochene natürliche Sprache eines Benutzers mit hoher Genauigkeit in Text um.
  • Sprachmodelle: Das KI-Gehirn verarbeitet diesen Text und versteht den Kontext, um intelligente Antworten zu generieren.
  • Text-to-Speech: Die Stimme wandelt Textantworten in natürlich klingende Sprache um.
  • Sprecherwechsel:Ein spezieller Dienst achtet auf Unterbrechungen und stellt sicher, dass das Gespräch natürlich und menschlich wirkt.

Als ich zu Stripe kam, bestand meine Aufgabe darin, so viel wie möglich vom Produkt aufzunehmen. Als Teil meiner Schulung würde ich erfahrenere Agenten begleiten und aus einer Vielzahl früherer Support-Interaktionen lernen – ein ähnlicher Ansatz wie ein KI-Agent lernen würde.

KI ist großartig bei der Mustererkennung und ein Großteil der Unterstützung besteht aus einer Mustererkennungsübung. Es beginnt damit, dass ein Benutzer sein Problem erklärt. Der Support-Mitarbeiter verarbeitet diese Informationen, versucht, sie mit seinem vorhandenen Wissen abzugleichen und präsentiert dem Benutzer eine Antwort. Support ist jedoch mehr als nur das Aufzählen einer Wissensdatenbank; guter Kundenservice erfordert Einfühlungsvermögen, Kreativität und die Zusammenarbeit mit einem Benutzer, um sein Problem zu lösen. Leider sind die meisten Supportinteraktionen mangelhaft.

Der Support-Status quo

Unterstützung ist ein wichtiger Kontaktpunkt, aber oft schmerzhaft. Denken Sie an das letzte Mal, als Sie eine Fluggesellschaft anrufen mussten. Sie hängen stundenlang in der Warteschleife und wenn Sie endlich jemanden erreichen, wird Ihnen gesagt, dass Ihr Problem an eine andere Abteilung gerichtet ist. Und der Sisyphus-Kreislauf geht weiter.

Nicht nur die Kunden leiden unter den Problemen. Es ist schwierig, ein großartiges Support-Erlebnis zu bieten, und im großen Maßstab noch schwieriger. In unserer softwarezentrierten Welt der Bits wird die Unterstützung weitgehend durch Atome eingeschränkt. Stellen Sie sich vor, Sie erhalten über Nacht einen großen Zustrom an Kunden: Sie können einfach eine AWS-Instanz starten, um Ihre Site am Laufen zu halten; Sie können nicht einfach einen Schalter umlegen und den Support einschalten.

Der Ausbau einer Supportfunktion kostet Zeit und Geld. In Nordamerika kostet die Suche, Schulung und Einarbeitung eines Support-Mitarbeiters etwa 12.000 US-Dollar. Einschließlich dieser anfänglichen Ausgaben betragen die durchschnittlichen Kosten für einen Support-Mitarbeiter etwa 30 bis 40 US-Dollar pro Stunde. Manche Unternehmen lagern ihre Support-Mitarbeiter aus und zahlen dafür einen Stundensatz zwischen 8 und 30 US-Dollar. Auf den ersten Blick ansprechend, aber mit dem niedrigen Preis geht ein Mangel an Kontrolle über Verantwortlichkeit, Prozesse und Supportqualität einher.

Doch was wäre, wenn Sie den Support innerhalb von Minuten einrichten und unbegrenzt skalieren könnten? Was wäre, wenn Sie zu geringen Kosten hochwertigen Support erhalten könnten? Das ist das Versprechen von Conversational AI, und nachdem ich jahrelang im Support gearbeitet habe, bin ich davon überzeugt, dass es eine völlige Wende bedeutet.

Alexis ist ein Beispiel für einen KI-Agenten von ElevenLabs. Es wurde als Support-Agent entwickelt in der ElevenLabs-Dokumentation Mittlerweile werden über einhundert Anrufe pro Tag abgewickelt.

Stellen Sie sich vor, Alexis wäre ein Mensch. Zunächst einmal glaube ich nicht, dass viele menschliche Support-Mitarbeiter 100 Anrufe pro Tag bearbeiten könnten. Ein sehr effizienter Agent und unkomplizierte Anrufe könnten etwa 60 Anrufe tätigen, ein weniger erfahrener Agent oder ein komplexerer Agent würde wahrscheinlich eher an 40 Anrufe herankommen. Sie müssten also mindestens zwei Agenten einstellen und wahrscheinlich Überstunden bezahlen.

Wären die Agenten in Nordamerika ansässig, würden sich die Kosten für die Bearbeitung von 100 Anrufen auf mindestens 700 US-Dollar belaufen, im Durchschnitt also etwa 1.719 US-Dollar, es könnten aber auch bis zu 4.094 US-Dollar hinzukommen. Das ist viel, daher könnten Sie sich für ein Outsourcing entscheiden. Das läge dann irgendwo zwischen 128 und 480 US-Dollar, im Durchschnitt also bei 288 US-Dollar. Das ist auf den ersten Blick viel billiger, aber es gibt versteckte Kosten für die Einarbeitung und Überwachung dieser Outsourcing-Unternehmen sowie ein Marken- und Reputationsrisiko, wenn sie Ihren Standards nicht entsprechen.

Support-Kostentabelle Tisch { Breite: 100 Rahmen-Zusammenbruch: Zusammenbruch; Marge: 20px 0; Schriftgröße: 16px; Textausrichtung: links; $ Tabelle thead { Hintergrundfarbe: #f2f2f2; $ Tabelle thead th { Polsterung: 10px; Rahmen unten: 2px durchgezogen #ddd; $ Tabelle tbody tr:nth-child(gerade) { Hintergrundfarbe: #f9f9f9; $ Tabelle tbody tr:n-tes-Kind(ungerade) { Hintergrundfarbe: #ffffff; $ Tabelle tbody td { Polsterung: 10px; Rahmen unten: 1px durchgezogen #ddd; $ t Fuß td { Schriftstil: kursiv; Textausrichtung: links; Polsterung: 10px; Farbe: #555; Hintergrundfarbe: #f2f2f2; Rahmen oben: 2px durchgezogen #ddd; $ Methode Mindest. Durchschnitt Max. Mensch (intern) 1,40 3,44 8.19 Menschlich (ausgelagert) 0,256 0,576 0,96 KI 0,026 0,031 0,036 Quelle: thinkhdi.com

Die Kosten für den Betrieb eines AI-Support-Agenten können nur 0,015 $ pro Minute für die Audiokomponente betragen. Der LLM kann je nach gewähltem Modell und Größe Ihrer Wissensbasis weniger als einen Cent bis hin zu ein paar Cent pro Minute kosten. Das wären also etwa 13 bis 18 US-Dollar für einhundert Anrufe. Das ist über 110-mal günstiger als der durchschnittliche interne Agent und 18-mal günstiger als der durchschnittliche ausgelagerte Agent. Als objektive Support-Erfahrung finde ich Alexis ziemlich großartig. Zu diesem Preis ist er unglaublich.

Konversations-KI in Aktion

In der weitgehend analogen Welt der Lieferketten Arbeit ist eine technologische Brücke für Talente und unterstützt Industrieunternehmen bei der Rekrutierung und Verwaltung ihrer Mitarbeiter. Traba stellt zwar Apps und Dashboards bereit, doch die Telefonkommunikation bleibt für eine Belegschaft, die an Arbeitszeitnachweise aus Papier und Jobbörsen aus Kork gewöhnt ist, ein entscheidender Faktor. 

Traba untersuchte, mit welchen Telefongesprächen sein Betriebsteam am meisten Zeit verbrachte, und fand zwei dominierende Bereiche: die Beantwortung von Supportanfragen und das Durchgehen von Checklisten zur Terminplanung. Für CTO Akshay Buddiga war Automatisierung die naheliegende Antwort, aber auch das Timing ist wichtig. „Wenn wir einen Prozess identifizieren, den wir effizienter gestalten möchten, binden wir die Automatisierung lieber frühzeitig ein, statt zu versuchen, Lösungen später nachzurüsten.“

Traba konzentriert sich voll und ganz auf die Stückkosten und darauf, bei technischen Innovationen immer einen Schritt voraus zu sein. Daher war die Verlagerung dieser Anrufe auf Konversations-KI aus mehreren Gründen attraktiv. Unter Berücksichtigung von Geschwindigkeit und Kosten suchte das Team nach Lösungen. Aber auch die Benutzererfahrung war entscheidend. Der Softwareentwickler Joseph Besgen bemerkte: „Wir wollten, dass es sich wie ein Gespräch anhört und nicht wie das Anhören einer Aufnahme.“ Die Demo von ElevenLabs klang so echt, dass der Vater eines Traba-Mitarbeiters beim Testen nicht sagen konnte, ob es sich um eine KI oder jemanden aus dem Team seines Sohnes handelte. 

Während die Dienstplanung Tausender Arbeiter in der Leichtindustrie eine gewisse Komplexität mit sich bringt, sollte es nicht so schwierig sein, einen (1) Arzttermin zu vereinbaren. Aber haben Sie in letzter Zeit versucht, Ihren Arzt anzurufen? Dies ist für die Patienten frustrierend und stellt eine ineffiziente Nutzung der Zeit des medizinischen Personals dar. In Partnerschaft mit ElevenLabs, EliseAIs Assistenten füllen die Lücke in der Gesundheitsverwaltung und kümmern sich um alles, von der Terminplanung bis zur Abrechnung. In einem Krankenhaus werden mittlerweile 86 % der Anrufe vollständig von KI-Agenten bearbeitet. Dies führt nicht nur zu einer Reduzierung der Kosten pro Anruf um 66 %, sondern auch zu Effizienzsteigerungen für das Verwaltungspersonal. EliseAI hat auch den Zugang zur Gesundheitsversorgung für nicht englischsprachige Gemeinschaften verbessert. 

Die Zukunft

Graph showing state of Conversational AI across industry sectors

Bei der Betrachtung des Wachstums der Konversations-KI nach Sektoren zeichnen sich einige interessante Trends ab. EdTech war die erste Branche, die sich der Konversations-KI zuwandte, da die Unternehmen endlich individuellen Einzelunterricht und Sprachunterricht zu einem erschwinglichen Preis anbieten konnten. Schnell folgten Anwendungen für den Kundensupport, da sich Support-Interaktionen besonders gut dafür eignen, weil es sich dabei um Übungen zur Mustererkennung handelt: Die Antwort liegt in einer Wissensdatenbank vor und der KI-Agent versucht, diese mit der Frage des Benutzers abzugleichen. Wir sehen auch einen Anstieg vertikalisierter End-to-End-Anwendungen, insbesondere in Sektoren wie Logistik und Gesundheitswesen – beispielsweise Traba und EliseAI. Auch hier handelt es sich um sich wiederholende und vorhersehbare Bereiche, die daher von einem KI-Agenten problemlos gehandhabt werden können.

Conversational AI bringt Unterstützung aus dem atomaren Bereich in die Welt der Bits. Jetzt kann der Support für Unternehmen und ihre Kunden zu einem besseren Erlebnis werden. Wie Ihr Cloud-Anbieter kann Ihr KI-Supportteam nach oben und unten skaliert werden. Ihre Kunden müssen nie in der Warteschleife warten und Sie ersparen sich den operativen Aufwand, Support-Center auf der ganzen Welt einzurichten.

Im vergangenen Jahr haben Sprachagenten gute Ergebnisse bei der Konversation und dem Abrufen von Wissen erzielt, aber ich denke, das ist erst der Anfang. Im Jahr 2025 glaube ich KI-Sprachagenten wird das Standardprotokoll für die Planung eingehender Besprechungen und Supportprobleme des Typs „Produktspezialist“ sein. Auch wenn diese möglicherweise auf Anrufe zum Abrufen von Informationen beschränkt sind, lässt sich dadurch das Supportvolumen deutlich verringern und menschliche Teams für höherwertige Arbeiten freisetzen.

Bis zum Jahr 2026 werden wir vom Abrufen von Wissen zum Ausführen von Aktionen übergegangen sein. Der standardmäßige KI-Sprachagent tätigt API-Anrufe und stellt eine Verbindung mit Apps von Drittanbietern her. Sie führen routinemäßig Aktionen durch, beispielsweise die Buchung von Besprechungen und die Ausstellung von Rückerstattungen.

Im Jahr 2027 sehe ich KI-Sprachagenten, die vom Support zum Kundenerfolg übergehen. Ich glaube, dass beispielsweise ganze Verkaufsabschlüsse von einem KI-Agenten abgewickelt werden, möglicherweise sowohl auf der Käufer- als auch auf der Verkäuferseite. Für viele scheint dies die letzte Grenze zu sein, aber ich denke, es ist erst der Anfang. Kontextbezogene und kreative Aufgaben, die unserer Ansicht nach früher ausschließlich dem Menschen vorbehalten waren, werden zunehmend zur Domäne der KI.

Der Support wird von einem Kostenzentrum zu einem neutralisierenden Faktor für die Ausgaben und wird schließlich zu einem Profitcenter für das Unternehmen. Sprachagenten mit künstlicher Intelligenz werden proaktiv auf Kunden zugehen, so die Abwanderung verringern und den Kunden-LTV erhöhen. Konversations-KI bietet viele der Vorteile menschlicher Unterstützung, verfügt aber darüber hinaus über ein perfektes Erinnerungsvermögen, kann Dutzende von Sprachen sprechen und ist rund um die Uhr einsatzbereit. Die Zukunft kommt, und in vielerlei Hinsicht ist sie bereits da. Stellen Sie sich sofortige, einfühlsame und wirksame Unterstützung vor – jedes Mal. Bald möchten Sie fast aus Spaß eine Fluggesellschaft anrufen.

Mehr entdecken

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden

Konversations-KI kann die Bereitstellung von Support kostengünstiger machen | ElevenLabs