Presenterar Eleven v3 Alpha

Prova v3

ElevenLabs samlar in 2 miljoner dollar och lanserar AI-talplattform som lovar att revolutionera ljudberättande

Företaget öppnar tillgång till Beta-plattformen som är utformad för att låta skapare och utgivare berätta långformatinnehåll

  • ElevenLabs lanserar Beta-plattform som låter kreatörer och utgivare berätta sina långformade innehåll
  • Den första finansieringsrundan leddes av Credo Ventures, med deltagande från Concept Ventures och enskilda investerare
  • Kapitalet kommer att driva forskning och utveckling av AI dubbning som planeras släppas senare i år


2023-01-23, London, UK | ElevenLabs, en startup inom AI-röstteknologi, bygger verktyg för realistisk talsyntes med det långsiktiga målet att omedelbart kunna konvertera talat ljud mellan språk. Idag meddelade de lanseringen av sin Beta-plattform efter att ha samlat in 2 miljoner dollar i en första finansieringsrunda ledd av Credo Ventures, med deltagande från Concept Ventures och andra enskilda investerare.

Företagets plattform låter kreatörer och utgivare berätta långformade innehåll och expandera till ljudformatet. Dess funktioner drivs av en egenutvecklad djupinlärningsmodell för talsyntes som realistiskt återger mänsklig intonation och betoningar, och kan justera leveransen baserat på kontext. ElevenLabs erbjuder också en uppsättning verktyg för Voice Cloning och design av syntetiska röster, med målet att ge användare nya kreativa möjligheter. Företaget arbetar för närvarande med utvalda utgivare på en dedikerad arbetsstation för voice-over-redigering som kommer att läggas till plattformen i början av februari. ElevenLabs strävar efter att bli den första AI-berättaren som erbjuder den kvalitet som krävs för att ge röst åt nyheter och ljudböcker i stor skala.

Framsteg i kapacitet kräver innovation, vilket är varför ElevenLabs ser sig själva främst som ett forskningsföretag. Mycket av denna forskning har hittills fokuserat på att utveckla nya text-to-speech-modeller som förlitar sig på hög kompression och kontextförståelse för att återge mänskligt tal ultrarealistiskt. Företaget har också byggt en ny modell för Voice Cloning som uppnår hög utgångslikhet utan träning (ingen finjustering), på prover så korta som 5 sekunder - en bedrift som tidigare var ohörd. Utvecklare kan komma åt alla dessa funktioner via API.

Denna forskning driver plattformens nuvarande funktioner men bidrar också till att förverkliga företagets ultimata mål att omedelbart konvertera talat ljud mellan språk. Deras AI dubbning-verktyg, som planeras släppas senare i år, kommer att låta användare automatiskt återge vilket ljud eller video som helst på ett annat språk, samtidigt som den ursprungliga talarens röst bevaras. ElevenLabs hoppas initialt attrahera kunder inom utbildningsområdet, medan det långsiktiga målet är att göra on-demand flerspråkigt ljudstöd till verklighet över streaming, ljudböcker, spel, filmer och till och med realtidskonversation.

Företagets talsyntes- och dubbning-verktyg är lika kompletterande som de är väl tajmade: båda lovar att föra ljud och video till bredare publik och båda kommer vid en tidpunkt då ljudområdet blomstrar. En tidig grupp testare, bland dem YouTube-skapare, utgivare och utvecklare, använder redan plattformen dagligen för att ge röst åt videor, berättelser och karaktärer, och företaget förväntar sig att sfären av potentiella tillämpningar för generativt tal bara kommer att expandera. Nyhetsutgivare har redan funnit att öka sin ljudnärvaro är ett bra sätt att engagera och behålla prenumeranter. Men att anlita röstskådespelare är dyrt, liksom att låta reportrar läsa sina berättelser. Bok- och nyhetsbrevsförfattare, och till och med spelutvecklare, står inför liknande utmaningar: de förstnämnda vänder sig alltmer till att berätta sina egna verk och de senare måste besluta om en viss karaktär motiverar inspelningskostnader. De som använder befintlig text-to-speech-programvara sparar pengar men betalar ett annat pris genom att kompromissa med kvaliteten. ElevenLabs insisterar på att det inte längre finns något behov av att kompromissa när de förbereder sig för att utrusta kreatörer och utgivare med de mest avancerade och mångsidiga AI-berättarverktygen.

“Plattformen vi lanserar nu handlar om att förvandla text till högkvalitativt talat ljud. Vi vill låta folk njuta av sin favoritbok eller nyhetsbrev genom att ge en röst åt alla författare, kreatörer och utvecklare som inte hade råd med en” - säger Mati Staniszewski, en medgrundare. “Vårt ultimata mål är att låta folk njuta av vilket innehåll de än finner relevant och intressant, oavsett vilket språk de talar” - tillägger Piotr Dabkowski, också en medgrundare.

På Credo Ventures strävar vi efter att arbeta med smarta och ambitiösa grundare från CEE-regionen. Vi såg hungern och gnistan i Matis och Piotrs ögon vid vårt allra första möte. Några månader senare håller de på att bli ett OpenAI-klassat forskningscentrum för röstteknologi som övervinner de största utmaningarna inom artificiellt ljud. Deras syntetiserade röster är redan omöjliga att skilja från verkliga och detta genombrott har inte bara kraftigt sänkt trösklarna för att generera innehåll i oöverträffad kvalitet och trohet, utan snart nog kommer det också att låta kreatörer radikalt expandera sina publik genom att bli flerspråkiga.– säger Maciek Gnutek, General Partner på Credo Ventures.

Trots att det är vanligt förekommande inom både underhållning och affärer, har ljud relativt försummats av de senaste framstegen inom forskning. Vi kunde inte vara mer exalterade över att stödja Mati & Piotr under denna gyllene era för generativ AI, och vi tror att ElevenLabs är teamet som kommer att föra denna teknologi till massorna, en röst i taget - säger Oliver Kicks, Principal på Concept Ventures.

Om ElevenLabs:
ElevenLabs är ett forskningsföretag som utvecklar AI-röstsyntesprogramvara för kreatörer och utgivare. Företagets verktyg återger anmärkningsvärt realistiskt tal och kan justera intonation och betoningar baserat antingen på kontext eller användarinstruktion. Företagets plattform strävar efter att erbjuda den nödvändiga kvaliteten och mångsidigheten för att bli en helhetslösning för att ge röst åt nyheter, nyhetsbrev, böcker och videor. Nyckelfunktioner inkluderar: textbaserad talgenerering, Voice Cloning, Voice Design och snart projektarbetsflöde för berättarredigering. ElevenLabs grundades 2022 av Piotr, en före detta Google-maskininlärningsingenjör, och Mati, en före detta Palantir-implementeringsstrateg. Företagets långsiktiga mål är att göra talat innehåll universellt tillgängligt på vilket språk och röst som helst.

Riskkapital tillhandahållet av Credo Ventures och Concept Ventures. Enskilda investerare inkluderar Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst och Harry Songhurst.

Kontakt
press@elevenlabs.io

Utforska mer

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in