Salta al contenuto

Dust aggiunge la voce multilingue ai workflow aziendali basati su IA grazie a ElevenLabs

Più accessibilità e produttività con l’IA orientata alla voce

Dust logo

Polvere, il sistema operativo per aziende AI-native, ora include input e output vocale multilingue grazie a ElevenLabs. Progettato per integrare i modelli nel lavoro quotidiano, Dust aveva bisogno di funzionalità vocali in grado di funzionare tra lingue, dispositivi e contesti diversi, con bassa latenza e un realismo elevato.

Non si trattava di un esperimento. La voce è diventata una priorità di prodotto dopo le richieste ripetute dei clienti. Il risultato: un sistema che permette l’interazione con gli agenti senza mani durante gli spostamenti, la collaborazione multilingue tra team globali e output audio professionali per workflow asincroni.

Perché la voce è importante in azienda

Dust ha individuato quattro requisiti fondamentali per la voce in ambito lavorativo:

  • Qualità naturale che resiste all’ascolto attento: L’output vocale deve suonare professionale e umano, adatto a essere condiviso in email ai clienti, podcast o demo di prodotto.
  • Multilingue di default: I team lavorano tra sedi e lingue diverse. Passare da francese, inglese e tedesco nella stessa sessione non deve essere un’eccezione.
  • Bassa latenza: Sia in input che in output, la velocità di risposta deve seguire il ritmo del pensiero e della conversazione.
  • Gestione dati a livello enterprise: Nessuna conservazione dei dati, instradamento regionale e conformità a SOC2 e GDPR erano imprescindibili.

Perché Dust ha scelto ElevenLabs

Dopo aver valutato fornitori come OpenAI, Google, Deepgram e AssemblyAI, Dust ha scelto ElevenLabs per la qualità superiore e la prontezza all’integrazione:

  • Text to Speech ha garantito sempre un realismo elevato e un’ampia gamma emotiva, fondamentale per gli strumenti Speech Generator e Sound Studio di Dust.
  • Speech to Text supporta la trascrizione in 99 lingue, con ottima fedeltà tra lingue diverse.
  • Nessuna conservazione dei dati e instradamento multi-regione garantiscono la conformità aziendale fin da subito.
  • SDK e API di livello production permettono integrazione rapida e prestazioni costanti su tutte le piattaforme.

Come Dust ha integrato la voce

Dust ha implementato il supporto vocale in due workflow principali:

1. Input vocale: parlare con gli agenti

Grazie al modello scribe_v1 di ElevenLabs, ora puoi parlare con gli agenti tramite microfono. Il sistema rileva automaticamente la lingua parlata, la trascrive e indirizza la richiesta, arrivando anche a riconoscere i nomi degli agenti dal parlato naturale.

L’input vocale è disponibile su mobile, ideale nei momenti in cui scrivere è meno pratico.

2. Output vocale: audio generato dagli agenti

Con Speech Generator, gli agenti Dust possono creare contenuti audio usando i modelli eleven_multilingual_v2 ed eleven_v3 di ElevenLabs. L’output include podcast, briefing e contenuti narrativi, utili sia internamente che per la condivisione esterna.

Sound Studio, alimentato daEffetti Sonori da testo, aggiunge livelli audio non verbali per la formazione e la creazione di contenuti.

Cosa ha imparato Dust

  • L’instradamento regionale fa la differenza: La possibilità di scegliere tra regioni UE/USA ha ridotto la latenza e semplificato la conformità.
  • La selezione conta più della quantità: Un set curato di 12 voci riduce la fatica decisionale e copre tutte le esigenze principali.
  • Qualità > velocità: Anche con modelli più rapidi disponibili, gli utenti hanno scelto costantemente voci di qualità superiore per i contenuti di produzione.

Cosa rende possibile tutto questo

  • Produttività mobile-first: Cattura idee e collabora ovunque ti trovi.
  • Collaborazione multilingue: Parla nella tua lingua: gli agenti si occupano del resto.
    Workflow accessibili e asincroni: Trasforma le ricerche in audio, abbassa le barriere di input e supporta diversi stili di lavoro.

Cosa c’è in arrivo

Dust sta esplorando agenti vocali conversazionali in tempo reale,agenti vocali conversazionali, una comprensione audio più profonda oltre la trascrizione e il supporto per input lunghi come riunioni e presentazioni. Integrando ElevenLabs, Dust rende la voce parte integrante dell’IA aziendale.

Scopri gli articoli del team ElevenLabs

Crea con l'audio IA della massima qualità