ElevenLabs raccoglie 2 milioni di dollari e annuncia la piattaforma di sintesi vocale IA che promette di rivoluzionare lo storytelling audio

Pubblicato: 23 gen 2023

AscoltaAscolta questo articolo

0:00

0:000:00

ElevenLabs lancia la piattaforma Beta che permette a creator ed editori di narrare i propri contenuti lunghi
Il round di finanziamento pre-seed è stato guidato da Credo Ventures, con la partecipazione di Concept Ventures e investitori individuali
Il capitale servirà a finanziare la ricerca e lo sviluppo dell’IA

23-01-2023, Londra, UK | ElevenLabs, startup specializzata in tecnologia vocale IA, sta sviluppando strumenti di sintesi vocale realistici con l'obiettivo a lungo termine di convertire istantaneamente l'audio parlato tra diverse lingue. Oggi annuncia il lancio della piattaforma Beta dopo aver raccolto 2 milioni di dollari in un round pre-seed guidato da Credo Ventures, con la partecipazione di Concept Ventures e altri investitori individuali.

La piattaforma dell’azienda permette a creator ed editori di narrare contenuti lunghi e di espandersi nel formato audio. Le sue funzionalità sono basate su un modello di deep learning sviluppato internamente per la sintesi vocale, che riproduce in modo realistico intonazione e inflessioni umane e può adattare la resa in base al contesto. ElevenLabs offre anche una suite di strumenti per

I grandi passi avanti richiedono innovazione, ed è per questo che ElevenLabs si considera prima di tutto un'azienda di ricerca. Gran parte di questa ricerca finora si è concentrata sullo sviluppo di nuovi modelli di text-to-speech che si basano su alta compressione e comprensione del contesto per riprodurre la voce umana in modo ultra-realistico. L'azienda ha anche sviluppato un nuovo modello di clonazione vocale che raggiunge un'elevata somiglianza di output senza training (senza fine-tuning), anche su campioni di soli 5 secondi – un risultato mai visto prima. Gli sviluppatori possono accedere a tutte queste funzionalità tramite API.

Questa ricerca alimenta le funzionalità attuali della piattaforma e contribuisce anche a realizzare l'obiettivo finale dell'azienda: convertire istantaneamente l'audio parlato tra diverse lingue. Il nostro strumento di doppiaggio IA, previsto per il rilascio entro la fine dell'anno, ti permetterà di ri-doppiare automaticamente qualsiasi audio o video in un'altra lingua, mantenendo la voce originale del parlante. Inizialmente ElevenLabs punta ad attirare clienti nel settore dell'istruzione, mentre l'obiettivo a lungo termine è offrire supporto audio multilingue on-demand su streaming,

Gli strumenti di sintesi vocale e doppiaggio dell'azienda sono complementari e arrivano in un momento perfetto: entrambi promettono di portare audio e video a un pubblico più ampio e arrivano proprio mentre il settore audio è in forte crescita. Un primo gruppo di tester, tra cui creator YouTube, editori e sviluppatori, già usa la piattaforma ogni giorno per dare voce a video, storie e personaggi, e l'azienda si aspetta che le applicazioni potenziali della generazione vocale continueranno ad aumentare. Gli editori di notizie hanno già scoperto che rafforzare la presenza audio è un ottimo modo per coinvolgere e fidelizzare gli abbonati. Ma ingaggiare doppiatori è costoso, così come far leggere le storie ai giornalisti. Anche autori di libri, newsletter e sviluppatori di videogiochi affrontano sfide simili: i primi scelgono sempre più spesso di narrare le proprie opere, i secondi devono valutare se un personaggio giustifica i costi di registrazione. Chi usa software di text-to-speech esistenti risparmia, ma spesso a scapito della qualità. ElevenLabs sostiene che non è più necessario scendere a compromessi, perché si prepara a offrire a creator ed editori gli strumenti di storytelling IA più avanzati e versatili.

“La piattaforma che lanciamo ora serve proprio a trasformare il testo in audio parlato di alta qualità. Vogliamo permettere a tutti di ascoltare il proprio libro o newsletter preferito dando voce a tutti quegli autori, creator e sviluppatori che finora non potevano permetterselo” - racconta Mati Staniszewski, co-fondatore. “Il nostro obiettivo finale è permettere a chiunque di ascoltare qualsiasi contenuto trovi interessante e rilevante, a prescindere dalla lingua che parla” - aggiunge Piotr Dabkowski, anche lui co-fondatore.

In Credo Ventures cerchiamo di collaborare con founder intelligenti e ambiziosi dell'area CEE. Abbiamo visto la determinazione e la scintilla negli occhi di Mati e Piotr già al primo incontro. Pochi mesi dopo stanno diventando un centro di ricerca sulla tecnologia vocale IA di livello OpenAI, superando le sfide più grandi dell'audio artificiale. Le loro voci sintetiche sono già indistinguibili da quelle reali e questa svolta non solo ha abbattuto le barriere per generare contenuti di qualità e fedeltà mai viste, ma presto permetterà anche ai creator di ampliare radicalmente il proprio pubblico grazie al multilingua.– commenta Maciek Gnutek, General Partner di Credo Ventures.

Nonostante sia ormai ovunque nell'intrattenimento e nel business, l'audio è stato relativamente trascurato dai recenti progressi della ricerca. Siamo entusiasti di sostenere Mati e Piotr in questa nuova era dell'IA generativa, e crediamo che ElevenLabs sia il team giusto per portare questa tecnologia al grande pubblico, una voce alla volta - dice Oliver Kicks, Principal di Concept Ventures.

Chi è ElevenLabs:
ElevenLabs è un'azienda di ricerca che sviluppa software di sintesi vocale IA per creator ed editori. I nostri strumenti generano parlato incredibilmente realistico e possono adattare intonazione e inflessioni in base al contesto o alle indicazioni dell’utente. La nostra piattaforma punta a offrire la qualità e la versatilità necessarie per diventare il punto di riferimento per dare voce a notizie, newsletter, libri e video. Le funzionalità principali includono: generazione vocale da testo, clonazione vocale,

Venture capital fornito da Credo Ventures e Concept Ventures. Tra gli investitori individuali: Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst e Harry Songhurst.

Contatti
press@elevenlabs.io

ElevenLabs raccoglie 2 milioni di dollari e annuncia la piattaforma di sintesi vocale IA che promette di rivoluzionare lo storytelling audio

Articoli simili

Ritorno a casa: ElevenLabs Summit arriva a Varsavia

Homecoming: portiamo l’ElevenLabs Summit a Varsavia

Voce IA per la Grecia

Presentiamo Stan Lee su ElevenLabs