Direkt zum Inhalt

Expressive Mode für ElevenAgents

Ausdrucksstärkere Voice Agents für echte Kundengespräche.

expressive mode

Heute stellen wir den Expressive Mode für ElevenAgents vor – Voice Agents, die so ausdrucksstark sind, dass die Grenze zwischen KI und Mensch verschwimmt.

Mit dem Expressive Mode steuern Teams den Tonfall präzise – so können Agents Gespräche deeskalieren, beruhigen und gezielt zur Lösung führen, auch unter Druck.

Dies ist eine unbearbeitete Aufnahme eines Agents, der empathisch auf einen Kunden mit maximaler Frustration nach einer Flugannullierung reagiert:

mark screenshot w caption space

Zwei zentrale Upgrades für den Expressive Mode

Er basiert auf zwei Upgrades:

  • Eleven v3 Konversation – unser emotional intelligentestes, kontextsensitives Text to Speech-Modell, entwickelt auf Basis von Eleven v3 und optimiert für Echtzeit-Dialoge.
  • Ein neues Turn-Taking-System – besser getimte Antworten mit weniger Unterbrechungen.

Diese Neuerungen wurden parallel entwickelt und greifen nahtlos ineinander – in ElevenAgents, unserer vollständig integrierten Plattform für konversationelle Agents.

Eleven v3 Konversation

Eleven v3 Conversational ist unser bisher emotional intelligentestes, kontextsensitives TTS-Modell – es hält den Gesprächskontext über mehrere Turns hinweg und liefert Sprache, die Absicht, Emotion und Betonung widerspiegelt, ohne gekünstelt zu wirken.

Sie können zum Beispiel einen Agenten anweisen, einen ruhigeren, beruhigenden Ton zu wählen, wenn ein Nutzer besorgt klingt – oder einen direkteren Ton, wenn Klarheit und Geschwindigkeit gefragt sind. Diese Steuerung hilft Teams, die Ansprache an Markenstimme und Nutzererwartungen anzupassen.

Ein neues Turn-Taking-System

Menschliche Gespräche hängen genauso sehr vom Timing wie von den Worten ab. Unterbrechen Sie zu früh, geht Vertrauen verloren. Reagieren Sie zu spät, ist der Moment vorbei.

Unser neues Turn-Taking-System nutzt Echtzeit-Signale aus unserem führenden Transkriptionsmodell, Scribe v2 Echtzeit um Emotionen aus der Sprechweise zu erkennen und besser zu bestimmen, wann ein Agent sprechen, pausieren oder warten sollte. So reagieren Agents menschlicher – besonders in emotional aufgeladenen Situationen.

Ein plötzlicher Anstieg der Sprechgeschwindigkeit – begleitet von Lautstärkespitzen und Wiederholungen – signalisiert oft akuten Stress oder Panik:

Im Gegensatz dazu steht eine helle, steigende Intonation mit kurzen Ausrufen oft für positive Überraschung oder Erleichterung:

Für den globalen Kundeneinsatz entwickelt

Expressive Mode bringt emotionale Nuancen in über 70 Sprachen und verbessert die Ansprache in Sprachen und Dialekten, bei denen dies bisher schwierig war, etwa Hindi.

Hören Sie einen Agenten in verschiedenen indischen Sprachen:

 / 

Und Spanisch mit argentinischem Akzent:

 / 

Testen Sie jetzt den Expressive Mode

Setzen Sie emotional ausdrucksstarke Agents ein, die markenkonform bleiben, im richtigen Moment reagieren und sich an echte Kundenemotionen anpassen – damit sich Ihre Kunden unterstützt fühlen, nicht abgefertigt.

Entwickelt für den produktiven Einsatz in ElevenAgents – mit der Zuverlässigkeit, Integration, dem Testing und Monitoring, die für groß angelegte Kundenprozesse nötig sind – von Pilotprojekten bis zu globalen Rollouts.

Testen Sie den Expressive ModeLive-Demo

Setzen Sie Agents ein, die emotional reagieren, zur Marke passen, im richtigen Moment antworten und sich echten Kundengefühlen anpassen – damit Kunden sich unterstützt fühlen, nicht abgefertigt.Dokumentation

Entdecken Sie Artikel des ElevenLabs-Teams

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden