ElevenLabs esce dalla fase «beta» e lancia Eleven Multilingual v2, un modello di conversazione IA in 30 lingue

Pubblicato: 22 ago 2023

AscoltaAscolta questo articolo

0:00

0:000:00

La piattaforma di voce IA ElevenLabs compie un grande passo avanti nei suoi sforzi per abbattere le barriere linguistiche dei contenuti con il lancio di un nuovo modello di deep learning, che offre funzionalità multilingue in 30 lingue: Eleven Multilingual v2.
Questo progresso permette a media, sviluppatori di videogiochi, editori e creatori indipendenti di tutto il mondo di rendere i propri contenuti molto più accessibili.
Queste nuove funzionalità, che arrivano dopo una serie di lanci e miglioramenti introdotti dalla piattaforma a partire da gennaio, segnano anche ufficialmente la fine della fase «beta» dell’azienda.
L’obiettivo di ElevenLabs è rendere ogni contenuto accessibile a tutti, in qualsiasi lingua e con qualsiasi voce.

Londra, Regno Unito - ElevenLabs, leader mondiale nel software di voce IA, ha annunciato oggi un nuovo modello di generazione vocale multilingue in 30 lingue, capace di produrre audio IA «ricco di emozioni» in modo accurato.

Questo progresso, frutto di ricerca interna, permette ai creatori di realizzare contenuti audio localizzati per i mercati internazionali di Europa, Asia e Medio Oriente. Negli ultimi 18 mesi ElevenLabs ha studiato i marcatori del parlato umano, sviluppando nuovi meccanismi per comprendere il contesto e trasmettere emozioni nella generazione vocale, oltre a sintetizzare voci nuove e uniche.

Con Eleven Multilingual v2, inserendo un testo nella piattaforma Text to Speech di ElevenLabs, il nuovo modello può riconoscere automaticamente circa 30 lingue e generare una voce con un livello di autenticità mai visto prima.

Inoltre, sia che si usi una voce sintetica sia una voce clonata, le caratteristiche vocali uniche del parlante vengono mantenute in tutte le lingue, compreso l’accento originale. Questo significa che puoi usare la stessa voce per dare vita ai tuoi contenuti in 30 lingue diverse.

Questo lancio arriva dopo la pubblicazione di Professional

Le lingue supportate includono coreano, olandese, turco, svedese, indonesiano, vietnamita, filippino, ucraino, greco, ceco, finlandese, rumeno, danese, bulgaro, malese, ungherese, norvegese, slovacco, croato, arabo classico e tamil. Si aggiungono alle lingue già disponibili: inglese, polacco, tedesco, spagnolo, francese, italiano, hindi e portoghese.

Dopo i recenti lanci di nuove funzionalità e con i continui miglioramenti della piattaforma, ElevenLabs ha confermato oggi che la piattaforma esce ufficialmente dalla fase «beta». Questo passaggio segna un momento cruciale nell’impegno dell’azienda: offrire strumenti affidabili e all’avanguardia a oltre 1 milione di utenti in tutto il mondo.

Guardando al futuro, ElevenLabs prevede di introdurre un meccanismo che permetterà agli utenti di condividere voci sulla piattaforma e di beneficiare dello sviluppo di nuovi file audio, favorendo così la collaborazione tra persone e IA.

Mati Staniszewski, CEO e co-fondatore di ElevenLabs, commenta:

«ElevenLabs è nata con il sogno di rendere ogni contenuto accessibile a tutti, in qualsiasi lingua e con qualsiasi voce. Con il lancio di Eleven Multilingual v2 siamo un passo più vicini a realizzare questo sogno e a rendere disponibili voci IA di qualità umana in tutti i dialetti».

«Le nostre soluzioni di generazione Text to Speech contribuiscono a creare pari opportunità e offrono capacità audio di alta qualità a tutti i creatori. Ora questi vantaggi si estendono anche alle applicazioni multilingue in quasi 30 lingue. Nel tempo, puntiamo a coprire ancora più lingue e voci grazie all’IA, eliminando le barriere linguistiche nei contenuti. In ElevenLabs crediamo che questi progressi nell’accessibilità favoriranno ancora più creatività, innovazione e diversità».

Riducendo i costi e le risorse necessarie per creare contenuti audio di alta qualità in più lingue, ElevenLabs permette ad aziende e creatori di produrre contenuti più creativi e accessibili in tutte le culture e lingue.

Per sviluppatori e editori di videogiochi indipendenti, lo strumento di generazione vocale multilingue offre nuove opportunità per tradurre esperienze di gioco e contenuti audio per un pubblico internazionale, raggiungendo giocatori e ascoltatori nelle loro lingue senza compromettere la qualità o la precisione dell’audio.

Allo stesso modo, le istituzioni educative ora possono offrire ai propri studenti contenuti audio accurati e nelle lingue di destinazione in modo immediato, rafforzando le competenze di comprensione e pronuncia nelle varie lingue e rispondendo ai diversi stili di insegnamento e alle esigenze di apprendimento degli studenti di tutto il mondo.

Qualsiasi tipo di creatore può usare lo strumento di ElevenLabs per migliorare l’accessibilità dei propri contenuti per persone con disabilità visive o bisogni educativi speciali, così che i contenuti visivi siano accompagnati da audio disponibili in più lingue.

Il primo set di strumenti vocali IA, presentato a gennaio 2023, includeva la possibilità di trasformare qualsiasi testo in voce scegliendo tra voci sintetiche predefinite e la possibilità di creare un clone della propria voce. Lo strumento di sintesi vocale multilingue rappresenta un ulteriore passo verso l’obiettivo di ElevenLabs: rendere ogni contenuto accessibile a tutti, in qualsiasi lingua e con qualsiasi voce.

Questa tecnologia è già stata adottata in diversi settori creativi, permettendo ad autori indipendenti di creare audiolibri, dare voce a personaggi secondari nei videogiochi, aiutare persone con disabilità visive ad accedere a contenuti scritti online e persino attivare il primo canale radio IA al mondo. ElevenLabs collabora con alcuni dei principali studi e creatori di contenuti, come i generatori di video IA D-ID, uno dei maggiori editori di audiolibri al mondo, Storytel, la piattaforma di video scientifici open access ScienceCast, il cui strumento di generazione video riassume le ricerche scientifiche pubblicate su arXiv, la piattaforma leader mondiale per la creazione di contenuti, TheSoul Publishing, gli sviluppatori di alcuni dei giochi più innovativi come Embark Studios e Paradox Interactive, e la piattaforma media MNTN.

ElevenLabs esce dalla fase «beta» e lancia Eleven Multilingual v2, un modello di conversazione IA in 30 lingue

Articoli simili

Presentiamo Dubbing v2

Presentiamo Music v2

Eleven v3 è ora disponibile per tutti

Presentiamo Scribe v2