ElevenLabs esce dalla fase beta e lancia Eleven Multilingual v2 – un modello linguistico IA di base per 30 lingue

Pubblicato: 22 ago 2023

AscoltaAscolta questo articolo

0:00

0:000:00

ElevenLabs, la piattaforma per l’IA linguistica, compie un passo avanti decisivo nel suo impegno a superare le barriere linguistiche nei contenuti, presentando un nuovo modello di deep learning che supporta funzionalità multilingue in 30 lingue – Eleven Multilingue v2
Questa novità permetterà a media company, sviluppatori di videogiochi, editori e autori indipendenti di tutto il mondo di rendere i propri contenuti molto più accessibili
Queste nuove capacità, che seguono una serie di funzioni e miglioramenti introdotti dal lancio della piattaforma a gennaio, segnano anche la fine ufficiale della fase beta dell’azienda
La missione di ElevenLabs è rendere tutti i contenuti accessibili universalmente, in qualsiasi lingua e con qualsiasi voce

Londra, Regno Unito– ElevenLabs, leader mondiale nel software di riconoscimento vocale basato su IA, ha annunciato oggi il lancio di un nuovo modello multilingue per la generazione vocale, capace di produrre audio IA “ricco di emozioni” in 30 lingue.

Sviluppato interamente sulla base di ricerca proprietaria, questo modello permette agli sviluppatori di creare contenuti audio localizzati per i mercati internazionali in Europa, Asia e Medio Oriente. Negli ultimi 18 mesi, ElevenLabs ha analizzato i tratti distintivi della voce umana, sviluppato nuovi meccanismi per comprendere il contesto e l’espressione delle emozioni nella generazione vocale e sintetizzato voci nuove e uniche.

Con Eleven Multilingual v2 il nuovo modello può riconoscere automaticamente quasi 30 lingue scritte quando inserisci un testo nella piattaforma Text to Speech di ElevenLabs e generare parlato in queste lingue con un livello di autenticità mai visto prima.

Che si utilizzi una voce sintetica o clonata, le caratteristiche uniche della voce originale vengono mantenute in tutte le lingue, compreso l’accento. Questo significa che puoi dare vita a contenuti in 30 lingue diverse usando la stessa voce.

Questa novità segue il rilascio pubblico di Professional

è praticamente indistinguibile dall’originale. Da oggi, la tua voce può parlare in quasi 30 lingue disponibili grazie al modello multilingue.

Le lingue supportate includono: coreano, olandese, turco, svedese, indonesiano, vietnamita, filippino, ucraino, greco, ceco, finlandese, rumeno, danese, bulgaro, malese, ungherese, norvegese, slovacco, croato, arabo standard e tamil. Queste lingue si aggiungono a quelle già disponibili: inglese, polacco, tedesco, spagnolo, francese, italiano, hindi e portoghese.

Dopo l’introduzione di nuove funzionalità e il continuo miglioramento della piattaforma, ElevenLabs ha confermato oggi che la piattaforma è ufficialmente uscita dalla fase beta. Questo passaggio segna un momento importante nell’impegno dell’azienda a offrire strumenti affidabili e all’avanguardia a oltre 1 milione di utenti in tutto il mondo.

Per il futuro, ElevenLabs prevede di introdurre un meccanismo che permetterà agli utenti di condividere le proprie voci sulla piattaforma e di beneficiare dello sviluppo di nuovi dati audio, favorendo la collaborazione tra persone e IA.

Mati Staniszewski, CEO e fondatore di ElevenLabs, ha dichiarato:

«ElevenLabs è nata dal sogno di rendere tutti i contenuti accessibili universalmente, in qualsiasi lingua e con qualsiasi voce. Con il lancio di Eleven Multilingual v2 siamo ancora più vicini a realizzare questo sogno, rendendo disponibili voci IA di qualità umana in ogni dialetto.

I nostri strumenti di sintesi vocale aprono nuove strade a tutti i creativi, offrendo opzioni di sintesi vocale di alta qualità. Ora questi vantaggi si estendono anche alle applicazioni multilingue in quasi 30 lingue. In futuro, speriamo di poter coprire ancora più lingue e voci grazie all’IA, eliminando le barriere linguistiche nei contenuti. Noi di ElevenLabs crediamo che questi passi avanti nell’accessibilità porteranno più creatività, innovazione e diversità.»

ElevenLabs riduce i costi e le risorse necessari per creare contenuti audio di alta qualità in più lingue. Aziende e creativi possono così produrre contenuti più accessibili e coinvolgenti, capaci di superare i confini culturali e linguistici.

Agli sviluppatori e agli editori di videogiochi indipendenti lo strumento di generazione vocale multilingue offre nuove possibilità per tradurre esperienze di gioco e contenuti audio per un pubblico internazionale, comunicando con giocatori e ascoltatori nella loro lingua senza compromessi su qualità o accuratezza della voce.

Allo stesso modo, anche le istituzioni educative possono ora offrire agli studenti contenuti audio precisi e immediati nella lingua di destinazione, migliorando la comprensione e la pronuncia e adattandosi ai diversi stili di insegnamento e alle esigenze degli studenti internazionali.

I creativi di ogni settore possono usare lo strumento di ElevenLabs per migliorare la accessibilità dei propri contenuti per persone con disabilità visive o bisogni educativi aggiuntivi, arricchendo i contenuti visivi con parlato in più lingue.

La prima suite di strumenti vocali IA, presentata a gennaio 2023, permette di trasformare qualsiasi testo in parlato scegliendo tra voci sintetiche predefinite o creando un clone della propria voce. Lo strumento di sintesi vocale multilingue è un ulteriore passo nella missione di ElevenLabs di rendere tutti i contenuti accessibili universalmente, in qualsiasi lingua e con qualsiasi voce.

La tecnologia è già utilizzata in molti settori creativi. Permette ad autori indipendenti di creare audiolibri, doppiare personaggi secondari nei videogiochi, facilitare l’accesso ai contenuti online scritti per persone con disabilità visive e gestire la prima radio IA al mondo. ElevenLabs ha anche stretto partnership con diversi creator e studi leader, tra cui il generatore video IA D-ID, Storytel, uno dei maggiori editori di audiolibri al mondo, la piattaforma video open access ScienceCast, il cui strumento di generazione video aggrega ricerche scientifiche pubblicate su arXiv, la piattaforma leader mondiale per la creazione di contenuti TheSoul Publishingsviluppatori di videogiochi straordinari come Embark Studiose Paradox Interactivee la piattaforma media MNTN.