Salta al contenuto

Presentiamo Expressive Mode per ElevenAgents

Agenti vocali più espressivi, pensati per conversazioni reali con i clienti.

expressive mode

Oggi presentiamo Expressive Mode per ElevenAgents - agenti vocali così espressivi da confondere il confine tra IA e conversazioni umane.

Expressive Mode offre ai team un controllo senza precedenti sul tono, così gli agenti possono stemperare, rassicurare e guidare le conversazioni verso una soluzione chiara, anche sotto pressione.

Questa è una registrazione non modificata di un agente che mostra empatia verso un cliente al massimo della frustrazione dopo una cancellazione di volo:

mark screenshot w caption space

Due aggiornamenti fondamentali alla base di Expressive Mode

Expressive Mode si basa su due aggiornamenti:

  • Eleven v3 Conversazionale - il nostro modello Text to Speech più intelligente dal punto di vista emotivo e attento al contesto, costruito su Eleven v3 e ottimizzato per il dialogo in tempo reale.
  • Un nuovo sistema di turn-taking - risposte più puntuali e meno interruzioni.

Questi aggiornamenti sono stati sviluppati in parallelo per integrarsi perfettamente all’interno di ElevenAgents, la nostra soluzione conversazionale verticale ElevenAgents.

Eleven v3 Conversazionale

Eleven v3 Conversational è il nostro modello TTS più intelligente dal punto di vista emotivo e attento al contesto: mantiene il contesto della conversazione tra i turni e genera parlato che riflette intenzione, emozione ed enfasi senza risultare artificiale o esagerato.

Ad esempio, puoi guidare un agente a usare un tono più calmo e rassicurante quando l’utente sembra preoccupato, oppure un tono più diretto quando servono chiarezza e rapidità. Questi controlli aiutano i team ad allineare la comunicazione alla voce del brand e alle aspettative degli utenti.

Un nuovo sistema di turn-taking

Nelle conversazioni umane il tempismo conta quanto le parole. Se interrompi troppo presto, perdi fiducia. Se rispondi troppo tardi, perdi il momento.

Il nostro nuovo sistema di turn-taking usa segnali in tempo reale dal nostro modello di trascrizione leader del settore, Scribe v2 in tempo reale, per capire l’emozione dal modo in cui viene detto qualcosa e determinare meglio quando un agente deve parlare, fare una pausa o aspettare. Così gli agenti rispondono in modo più naturale, soprattutto nelle situazioni emotivamente intense.

Un improvviso aumento della velocità di parlata, insieme a volume alto e ripetizioni, spesso segnala forte stress o panico:

Al contrario, un’intonazione crescente e brillante con brevi esclamazioni spesso indica sorpresa piacevole o sollievo:

Pensato per le operazioni globali con i clienti

Expressive Mode porta la sfumatura emotiva in oltre 70 lingue, migliorando la resa in lingue e dialetti dove prima la sfumatura era meno efficace, come l’hindi.

Ascolta un agente che parla in diverse lingue indiane:

 / 

E in spagnolo con accento argentino:

 / 

Prova Expressive Mode oggi stesso

Attiva agenti espressivi che restano in linea con il brand, rispondono al momento giusto e si adattano alle vere emozioni dei clienti, così chi ti contatta si sente davvero aiutato.

Pensato per la produzione in ElevenAgents, con l’affidabilità, le integrazioni, i test e il monitoraggio necessari per operazioni su larga scala: dai progetti pilota ai rollout globali.

Provalo subito: Demo live

Leggi la documentazione: Documentazione

Scopri gli articoli del team ElevenLabs

Crea con l'audio IA della massima qualità