ElevenLabs släpper nya Voice AI-produkter och samlar in 80 miljoner USD i serie B

Att stärka sin position inom röst AI-forskning och produktutveckling

  • ElevenLabs har tagit upp en $80 miljoner serie B-omgång leds av Andreessen Horowitz, Nat Friedman, Daniel Gross, och sällskap av Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital och Credo Ventures att stärka sin position som ledare inom röst-AI.
  • Företaget avslöjar också idag en uppsättning nya produkter, bl.a Dubbningsstudio, Röstbibliotek marknadsplats, en tidig förhandsvisning av en App för mobilläsare, och nya modeller med förbättrad hastighet och språktäckning.
  • Sedan lanseringen har ElevenLabs-teknologin förbättrat innehållstillgängligheten globalt inom sektorer som skaparekonomin, publicering, konversations-AI, underhållning, utbildning och tillgänglighet, med dess antagande av miljontals människor som har lett företaget till enhörningsstatus.

22 januari / Global - ElevenLabs, ett forskningsföretag för röstteknologi, har samlat in en serie B-omgång på 80 miljoner dollar som leds av Andreessen Horowitz, Nat Friedman, Daniel Gross, och anslöt sig till Sequoia Capital, SV Angel, Smash Capital, BroadLight Capital och Credo Ventures, för att befästa sin position som världsledande inom röst-AI-forskning och produktdistribution.

Sedan den offentliga lanseringen har ElevenLabs lett branschen inom naturlig talsyntes, vilket gör det möjligt för användare att skapa och designa AI-röster över ett stort antal språk och accenter, med förmågan att leverera ett brett utbud av känslor och intonationer. Sedan lanseringen har ElevenLabs användare genererat över 100 år av ljud, medan företaget växte från 5 till 40 anställda. Idag används ElevenLabs teknologi av anställda på 41 % av Fortune 500 företag. 

ElevenLabs teknologi har använts i många vertikaler. Det har gett kreatörer möjlighet att förbättra publikens upplevelser med voiceovers och AI-dubbning, breddat tillgången till utbildning och tillhandahållit innovativa lösningar inom ljudbokspublicering, underhållning och personlig användning, inklusive förbättrad tillgänglighet. Denna finansiering kommer att användas för att ytterligare förfina företagets produktutbud samtidigt som den säkerställer säker användning av AI-teknik.

Förutom dagens serie B-meddelande avtäcker ElevenLabs också flera nya produktutvecklingar, som kommer att gå live under de kommande veckorna:

  • En ny Dubbningsstudio arbetsflödet gör det möjligt för användare att dubba hela filmer, samt generera och redigera sina transkriptioner, översättningar och tidskoder, vilket ger ytterligare kontroll över innehållsproduktion. Dessa funktioner kompletterar den redan befintliga AI-dubbningsfunktionen som möjliggör automatiserad, end-to-end videolokalisering på 29 språk.
  • A Röstbibliotek marknadsplats som kommer att tillhandahålla en säker plattform för användare att tjäna på AI-versioner av sina egna röster. Användare kan skapa sin professionella AI-röstreplik, verifiera den och dela den via Voice Library. När andra använder dessa verifierade röster får de ursprungliga skaparna kompensation. Användare behåller alltid kontrollen över sin rösts tillgänglighet och ersättningsvillkor. Marknaden genererar redan inkomster för en liten grupp alfa-användare.
  • En tidig förhandstitt av Mobilapp läsare att möjliggör omedelbar konvertering av text och webbadresser till ljud, vilket gör det lättare för användare att komma åt innehåll i ett annat medium när de är på resande fot. Som en introduktionstest kommer appen att vara tillgänglig gratis under de första tre månaderna och användare kommer att kunna registrera sig för tidig åtkomst via en väntelista.

Under 2023 har ElevenLabs också utökat sin närvaro i flera sektorer, inklusive publicering, spel, media och konversationsvertikaler, samt skapat B2B-partnerskap med stora mediehus, bland dem:

  • Publicering: Storytel, The Washington Post, Rheinische Post, Curio
  • Konversations-AI: FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana
  • Media & Underhållning: Wondershare Filmora, Futuri Media, TheSoul Publishing
  • Spelande: Paradox Interactive, NetEase, Inworld AI

Dessa senaste produktlanseringar och partnerskap följer en period då ElevenLabs kontinuerligt har utökat sin uppsättning verktyg, alla utvecklade från intern forskning. Utgivningarna har inkluderat: Talsyntes för verklighetstrogen text-to-speech konvertering, tillsammans med en Turbo-modell optimerad för latens; Röstdesign och Röstkloning för att skapa skräddarsydda röster; Tal till tal för att förvandla en röst till en annan. Företaget släppte också sin branschledande AI-dubbning verktyg, som automatiskt kan översätta ljud och video till 29 språk samtidigt som den ursprungliga talarens röst och känslor bevaras. Företaget kommer också snart att utöka modellerna Turbo och Speech to Speech, som för närvarande finns på engelska, till en bredare uppsättning språk. 

Utöver forskningen som driver dessa funktioner har ElevenLabs också arbetat med att utveckla avancerade verktyg för mer komplexa arbetsflöden, som Projekt för publicering, och Dubbningsstudio för videolokalisering. Projekt effektiviserar redigering, strukturering, navigering och generering av långformat innehåll för utgivare, och Dubbningsstudio hjälper till att förbereda innehåll för publik över hela världen genom att ge praktisk kontroll över transkription, översättning och sekvenstiming.

Företaget har också utvecklat samhällsorienterade produkter som Röstbibliotek - en miljö för att dela AI-genererade röster. Tidigare begränsad till att dela konstgjorda röster skapade med Voice Design-verktyget, låter Voice Library nu användare dela sina egna verifierade röstrepliker gjorda med Professional Voice Cloning som en del av den nyligen introducerade Röstbibliotek marknadsplats och tjäna pengar när andra använder dem. För att säkerställa marknadens säkerhet och integritet använder ElevenLabs sin Professional Voice Cloning-teknik för att skapa högtrogna röstrepliker. Innan de delar en röst måste användare klara en Voice Captcha-verifiering genom att läsa en textuppmaning inom en viss tidsram för att bekräfta att deras röst matchar träningsexemplen. Den här processen, tillsammans med ElevenLabs-teamets moderering och manuella godkännande, säkerställer att autentiska, användarverifierade röster delas och tjänar pengar, vilket skapar en säkrare och mer pålitlig miljö.

En kärnprioritet för ElevenLabs är en säker och ansvarsfull utveckling av AI, med fokus på att möjliggöra upptäckt för att säkerställa att allt AI-genererat innehåll är tydligt identifierbart. Företaget lanserade en AI-talklassificerare förra året; ett verktyg som kan verifiera om ett ljudexempel innehåller ElevenLabs-genererat innehåll. I år kommer företaget att arbeta med att förbättra Classifiers kapacitet för att täcka fler röst-AI-modeller, samt samarbeta med andra distributionsplattformar för bredare implementering. ElevenLabs utvecklar aktivt ytterligare skyddsåtgärder för att öka säkerheten i det offentliga området.

Med denna serie B-investering avser ElevenLabs att befästa sin position som den globala ledaren inom röst-AI-forskning och produktdistribution. Kapitalet kommer att läggas på att främja forskning, utöka infrastrukturen, utveckla nya produkter för specifika vertikaler och förbättra säkerhetsåtgärder för att säkerställa en ansvarsfull och etisk utveckling av AI-teknik.

Piotr Dąbkowski, CTO för ElevenLabs, tillägger:

"Vårt teams engagemang har redan haft en bestående inverkan på röst-AI. Denna nya finansiering gör det möjligt för oss att ta oss an ännu större utmaningar och fokusera på att behålla vår konkurrensfördel inom forskning och produktutveckling."

Mati Staniszewski avslutar:

"Vår ambition är densamma – att förändra hur vi interagerar med innehåll genom att bryta ned språk- och kommunikationsbarriärer. Vi bygger banbrytande teknik för att göra innehåll tillgängligt på olika språk – och röster – så att alla kan få kontakt med information och berättelser som är viktiga. Våra framsteg hittills är ett bevis på vårt dedikerade team och investerare, och även om det fortfarande bara är början på vår resa, hjälper vi tillsammans att forma framtiden för tillgänglighet och kommunikation.”

Utforska mer

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in