ElevenLabs esce dalla Beta e lancia Eleven Multilingual v2: un modello IA per la sintesi vocale in quasi 30 lingue

Pubblicato: 22 ago 2023

AscoltaAscolta questo articolo

0:00

0:000:00

La piattaforma di Voice AI ElevenLabs compie un salto radicale nella rimozione delle barriere linguistiche dei contenuti grazie al rilascio di un nuovo modello di deep learning che supporta funzionalità multilingue in 28 lingue - il Eleven Multilingue v2
Questo progresso permette a media company, sviluppatori di videogiochi, editori e creatori indipendenti di tutto il mondo di rendere i propri contenuti molto più accessibili
Queste nuove funzionalità, che seguono una serie di aggiornamenti e miglioramenti introdotti dalla piattaforma dal lancio a gennaio, segnano anche la fine ufficiale della fase Beta dell’azienda
La missione di ElevenLabs è rendere tutti i contenuti accessibili a chiunque, in qualsiasi lingua e con qualsiasi voce

ElevenLabs, leader mondiale nel software di voice AI, ha lanciato oggi un nuovo modello multilingue per la generazione vocale in grado di produrre audio IA “ricco di emozioni” in quasi 30 lingue.

Try Multilingual v2

Questo progresso, frutto di ricerca interna, permette ai creatori di produrre contenuti audio localizzati per i mercati internazionali in Europa, Asia e Medio Oriente. Negli ultimi 18 mesi ElevenLabs ha analizzato i tratti distintivi del parlato umano, sviluppando nuovi meccanismi per comprendere il contesto e trasmettere emozioni nella generazione vocale, oltre a sintetizzare voci nuove e uniche.

Con Eleven Multilingual v2, quando inserisci un testo nella piattaforma Text to Speech di ElevenLabs, il nuovo modello può riconoscere automaticamente quasi 30 lingue scritte e generare parlato in ognuna con un livello di autenticità mai visto prima.

Allo stesso tempo, sia che venga usata una voce sintetica che una voce clonata, le caratteristiche uniche della voce vengono mantenute in tutte le lingue, compreso l’accento originale. Questo significa che puoi usare la stessa voce per dare vita ai tuoi contenuti in 28 lingue diverse.

Questo aggiornamento segue il rilascio pubblico della Clonazione Vocale IA professionale per tutti i creatori sulla piattaforma. Questo aggiornamento, disponibile insieme a nuove funzionalità di sicurezza, permette di creare una copia digitale perfetta della propria voce, praticamente indistinguibile dall’originale. Da oggi la tua voce potrà parlare in quasi 30 lingue grazie al modello multilingue.

Le lingue ora supportate includono: Cinese, Coreano, Olandese, Turco, Svedese, Indonesiano, Filippino, Giapponese, Ucraino, Greco, Ceco, Finlandese, Romeno, Danese, Bulgaro, Malese, Slovacco, Croato, Arabo classico Arabo e Tamil.

Si aggiungono alle lingue già disponibili tra cui Inglese, Polacco, Tedesco, Spagnolo, Francese, Italiano, Hindi e Portoghese.

Dopo i recenti lanci di nuove funzionalità e i continui miglioramenti della piattaforma, ElevenLabs conferma oggi l’uscita ufficiale dalla Beta. Questo passaggio segna un momento chiave nell’impegno dell’azienda a offrire strumenti affidabili e all’avanguardia ai suoi oltre 1 milione di utenti in tutto il mondo.

Guardando al futuro, ElevenLabs prevede di introdurre un meccanismo che permetterà agli utenti di condividere le voci sulla piattaforma e di contribuire allo sviluppo di nuovi contenuti audio, favorendo la collaborazione tra persone e IA.

Mati Staniszewski, CEO e co-fondatore di ElevenLabs, commenta:

ElevenLabs è nata con il sogno di rendere tutti i contenuti accessibili a chiunque, in qualsiasi lingua e con qualsiasi voce. Con il lancio di Eleven Multilingual v2 siamo un passo più vicini a realizzare questo sogno e a rendere le voci IA disponibili in ogni dialetto.

I nostri strumenti di generazione text-to-speech aiutano a livellare il campo e portano capacità audio di altissima qualità a tutti i creatori. Ora questi vantaggi si estendono anche alle applicazioni multilingue in quasi 30 lingue. In futuro vogliamo coprire ancora più lingue e voci grazie all’IA, eliminando le barriere linguistiche ai contenuti. In ElevenLabs crediamo che questi passi avanti nell’accessibilità favoriranno creatività, innovazione e diversità.

Riducendo i costi e le risorse necessari per creare contenuti audio di alta qualità in più lingue, ElevenLabs permette ad aziende e creatori di produrre contenuti più creativi e accessibili, capaci di coinvolgere culture e lingue diverse.

Per sviluppatori e editori di videogiochi indipendenti, lo strumento di generazione vocale multilingue offre nuove opportunità per tradurre esperienze di gioco e contenuti audio per il pubblico internazionale, raggiungendo giocatori e ascoltatori nelle loro lingue senza compromettere la qualità o la precisione dell’audio.

Allo stesso modo, le istituzioni educative ora possono offrire agli studenti contenuti audio accurati nelle lingue di destinazione in modo immediato, migliorando la comprensione e la pronuncia, e adattandosi a diversi stili di insegnamento e bisogni di apprendimento degli studenti internazionali.

Tutti i creatori possono usare lo strumento di ElevenLabs per migliorare l’accessibilità dei contenuti per persone con disabilità visive o bisogni educativi aggiuntivi, integrando i contenuti visivi con parlato disponibile in più lingue.

La prima suite di strumenti vocali IA presentata a gennaio 2023 includeva la possibilità di trasformare qualsiasi testo in parlato tramite una selezione di voci sintetiche predefinite e la possibilità di creare un clone della propria voce. Lo strumento di sintesi vocale multilingue è un ulteriore passo avanti nella missione di ElevenLabs di rendere tutti i contenuti accessibili a chiunque, in qualsiasi lingua e con qualsiasi voce.

La tecnologia è già stata adottata in diversi settori creativi, permettendo ad autori indipendenti di creare audiolibri, di dare voce a personaggi secondari nei videogiochi, di aiutare persone con disabilità visive ad accedere a contenuti scritti online e di alimentare il primo canale radiofonico IA al mondo. ElevenLabs ha anche collaborato con diversi creatori di contenuti e studi di riferimento, tra cui generatori video IA come D-ID, uno dei maggiori editori di audiolibri al mondo Storytel, piattaforma video scientifica open-access ScienceCast il cui strumento di generazione video sintetizza articoli scientifici pubblicati su arXiv, principale piattaforma globale per creatori di contenuti TheSoul Publishing, sviluppatori di videogiochi come Embark Studios e Paradox Interactive, e la piattaforma media MNTN.

Contatto
press@elevenlabs.io

ElevenLabs esce dalla Beta e lancia Eleven Multilingual v2: un modello IA per la sintesi vocale in quasi 30 lingue

Articoli simili

La strada verso il doppiaggio in tempo reale

ElevenLabs esce dalla beta e lancia Eleven Multilingual v2, il modello AI di base per la voce in 30 lingue

ElevenLabs esce dalla fase «beta» e lancia Eleven Multilingual v2, un modello di conversazione IA in 30 lingue

ElevenLabs esce dalla fase beta e lancia Eleven Multilingual v2 – un modello linguistico IA di base per 30 lingue