Salta al contenuto

ElevenLabs raccoglie 2 milioni di dollari e annuncia la piattaforma di sintesi vocale IA che promette di rivoluzionare lo storytelling audio

L'azienda apre l'accesso alla piattaforma Beta pensata per permettere a creator ed editori di narrare contenuti lunghi

  • ElevenLabs lancia la piattaforma Beta che permette a creator ed editori di narrare i propri contenuti lunghi
  • Il round di finanziamento pre-seed è stato guidato da Credo Ventures, con la partecipazione di Concept Ventures e investitori individuali
  • Il capitale servirà a finanziare la ricerca e lo sviluppo del doppiaggio IA previsto per il lancio entro la fine dell'anno


23-01-2023, Londra, UK | ElevenLabs, startup specializzata in tecnologia vocale IA, sta sviluppando strumenti di sintesi vocale realistici con l'obiettivo a lungo termine di convertire istantaneamente l'audio parlato tra diverse lingue. Oggi annuncia il lancio della piattaforma Beta dopo aver raccolto 2 milioni di dollari in un round pre-seed guidato da Credo Ventures, con la partecipazione di Concept Ventures e altri investitori individuali.

La piattaforma dell'azienda permette a creator ed editori di narrare contenuti lunghi ed espandersi nel formato audio. Le sue funzionalità sono alimentate da un modello di deep learning proprietario per la sintesi vocale, in grado di riprodurre in modo realistico intonazione e inflessioni umane, adattando la resa in base al contesto. ElevenLabs offre anche una suite di strumenti per la clonazione vocale e la creazione di voci sintetiche, pensata per offrire agli utenti nuove possibilità creative. Attualmente l'azienda collabora con editori selezionati su una workstation dedicata al montaggio della voce fuori campo, che sarà aggiunta alla piattaforma a inizio febbraio. ElevenLabs punta a diventare il primo narratore IA in grado di offrire la qualità necessaria per dare voce a notizie e audiolibri su larga scala.

I grandi passi avanti richiedono innovazione, ed è per questo che ElevenLabs si considera prima di tutto un'azienda di ricerca. Gran parte di questa ricerca finora si è concentrata sullo sviluppo di nuovi modelli di text-to-speech che si basano su alta compressione e comprensione del contesto per riprodurre la voce umana in modo ultra-realistico. L'azienda ha anche sviluppato un nuovo modello di clonazione vocale che raggiunge un'elevata somiglianza di output senza training (senza fine-tuning), anche su campioni di soli 5 secondi – un risultato mai visto prima. Gli sviluppatori possono accedere a tutte queste funzionalità tramite API.

Questa ricerca alimenta le funzionalità attuali della piattaforma ma contribuisce anche a realizzare l'obiettivo finale dell'azienda: convertire istantaneamente l'audio parlato tra lingue diverse. Il loro strumento di doppiaggio IA, previsto per il lancio entro la fine dell'anno, permetterà agli utenti di ri-doppiare automaticamente qualsiasi audio o video in un'altra lingua, mantenendo la voce originale del parlante. Inizialmente ElevenLabs punta ad attrarre clienti nel settore dell'istruzione, mentre l'obiettivo a lungo termine è rendere possibile il supporto audio multilingue on-demand su streaming, audiolibri, gaming, cinema e persino conversazioni in tempo reale.

Gli strumenti di sintesi vocale e doppiaggio dell'azienda sono complementari e arrivano in un momento perfetto: entrambi promettono di portare audio e video a un pubblico più ampio e arrivano proprio mentre il settore audio è in forte crescita. Un primo gruppo di tester, tra cui creator YouTube, editori e sviluppatori, già usa la piattaforma ogni giorno per dare voce a video, storie e personaggi, e l'azienda si aspetta che le applicazioni potenziali della generazione vocale continueranno ad aumentare. Gli editori di notizie hanno già scoperto che rafforzare la presenza audio è un ottimo modo per coinvolgere e fidelizzare gli abbonati. Ma ingaggiare doppiatori è costoso, così come far leggere le storie ai giornalisti. Anche autori di libri, newsletter e sviluppatori di videogiochi affrontano sfide simili: i primi scelgono sempre più spesso di narrare le proprie opere, i secondi devono valutare se un personaggio giustifica i costi di registrazione. Chi usa software di text-to-speech esistenti risparmia, ma spesso a scapito della qualità. ElevenLabs sostiene che non è più necessario scendere a compromessi, perché si prepara a offrire a creator ed editori gli strumenti di storytelling IA più avanzati e versatili.

“La piattaforma che lanciamo ora serve proprio a trasformare il testo in audio parlato di alta qualità. Vogliamo permettere a tutti di ascoltare il proprio libro o newsletter preferito dando voce a tutti quegli autori, creator e sviluppatori che finora non potevano permetterselo” - racconta Mati Staniszewski, co-fondatore. “Il nostro obiettivo finale è permettere a chiunque di ascoltare qualsiasi contenuto trovi interessante e rilevante, a prescindere dalla lingua che parla” - aggiunge Piotr Dabkowski, anche lui co-fondatore.

In Credo Ventures cerchiamo di collaborare con founder intelligenti e ambiziosi dell'area CEE. Abbiamo visto la determinazione e la scintilla negli occhi di Mati e Piotr già al primo incontro. Pochi mesi dopo stanno diventando un centro di ricerca sulla tecnologia vocale IA di livello OpenAI, superando le sfide più grandi dell'audio artificiale. Le loro voci sintetiche sono già indistinguibili da quelle reali e questa svolta non solo ha abbattuto le barriere per generare contenuti di qualità e fedeltà mai viste, ma presto permetterà anche ai creator di ampliare radicalmente il proprio pubblico grazie al multilingua.– commenta Maciek Gnutek, General Partner di Credo Ventures.

Nonostante sia ormai ovunque nell'intrattenimento e nel business, l'audio è stato relativamente trascurato dai recenti progressi della ricerca. Siamo entusiasti di sostenere Mati e Piotr in questa nuova era dell'IA generativa, e crediamo che ElevenLabs sia il team giusto per portare questa tecnologia al grande pubblico, una voce alla volta - dice Oliver Kicks, Principal di Concept Ventures.

Chi è ElevenLabs:
ElevenLabs è un'azienda di ricerca che sviluppa software di sintesi vocale IA per creator ed editori. I suoi strumenti generano parlato incredibilmente realistico e possono adattare intonazione e inflessioni sia in base al contesto che alle istruzioni dell'utente. La piattaforma punta a offrire la qualità e la versatilità necessarie per diventare il punto di riferimento per dare voce a notizie, newsletter, libri e video. Tra le funzionalità principali: generazione vocale da testo, clonazione vocale, creazione di voci e, a breve, workflow di progetto per il montaggio della narrazione. ElevenLabs è stata fondata nel 2022 da Piotr, ex ingegnere machine learning di Google, e Mati, ex strategist di Palantir. L'obiettivo a lungo termine dell'azienda è rendere i contenuti parlati accessibili a tutti, in qualsiasi lingua e voce.

Venture capital fornito da Credo Ventures e Concept Ventures. Tra gli investitori individuali: Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst e Harry Songhurst.

Contatti
press@elevenlabs.io

Scopri gli articoli del team ElevenLabs

Crea con l'audio IA della massima qualità