Gå till innehåll

ElevenLabs samlar in 2 miljoner dollar och lanserar AI-talplattform som lovar att revolutionera ljudberättande

Publicerad

LyssnaLyssna på den här artikeln

  • ElevenLabs lanserar Beta-plattform som låter kreatörer och utgivare berätta sina långformade innehåll
  • Den första finansieringsrundan leddes av Credo Ventures, med deltagande från Concept Ventures och enskilda investerare
  • Kapitalet kommer att driva forskning och utveckling av AI-


2023-01-23, London, Storbritannien | ElevenLabs, en startup inom AI-röstteknologi, bygger verktyg för realistisk talsyntes med det långsiktiga målet att omedelbart kunna konvertera talat ljud mellan språk. Idag meddelade de lanseringen av sin Beta-plattform efter att ha samlat in 2 miljoner dollar i en första finansieringsrunda ledd av Credo Ventures, med deltagande från Concept Ventures och andra enskilda investerare.

Vår plattform gör det möjligt för kreatörer och utgivare att berätta längre innehåll och ta steget till ljudformatet. Funktionerna drivs av en egenutvecklad deep learning-modell för talgenerering som återskapar mänsklig intonation och betoning på ett realistiskt sätt, och kan anpassa leveransen efter sammanhanget. Vi erbjuder också verktyg för

Framsteg i kapacitet kräver innovation, vilket är varför ElevenLabs ser sig själva främst som ett forskningsföretag. Mycket av denna forskning har hittills fokuserat på att utveckla nya text-to-speech-modeller som förlitar sig på hög kompression och kontextförståelse för att återge mänskligt tal ultrarealistiskt. Företaget har också byggt en ny modell för Voice Cloning som uppnår hög utgångslikhet utan träning (ingen finjustering), på prover så korta som 5 sekunder - en bedrift som tidigare var ohörd. Utvecklare kan komma åt alla dessa funktioner via API.

Den här forskningen ligger bakom plattformens nuvarande funktioner, men bidrar också till vårt långsiktiga mål: att direkt kunna översätta talat ljud mellan olika språk. Vårt AI-dubbningsverktyg, som planeras att släppas senare i år, låter dig automatiskt ge nytt språk till vilket ljud eller video som helst, samtidigt som den ursprungliga rösten bevaras. Vi hoppas först locka kunder inom utbildning, men på sikt vill vi göra efterfrågad flerspråkig ljudsupport möjlig inom streaming,

Företagets talsyntes- och dubbning-verktyg är lika kompletterande som de är väl tajmade: båda lovar att föra ljud och video till bredare publik och båda kommer vid en tidpunkt då ljudområdet blomstrar. En tidig grupp testare, bland dem YouTube-skapare, utgivare och utvecklare, använder redan plattformen dagligen för att ge röst åt videor, berättelser och karaktärer, och företaget förväntar sig att sfären av potentiella tillämpningar för generativt tal bara kommer att expandera. Nyhetsutgivare har redan funnit att öka sin ljudnärvaro är ett bra sätt att engagera och behålla prenumeranter. Men att anlita röstskådespelare är dyrt, liksom att låta reportrar läsa sina berättelser. Bok- och nyhetsbrevsförfattare, och till och med spelutvecklare, står inför liknande utmaningar: de förstnämnda vänder sig alltmer till att berätta sina egna verk och de senare måste besluta om en viss karaktär motiverar inspelningskostnader. De som använder befintlig text-to-speech-programvara sparar pengar men betalar ett annat pris genom att kompromissa med kvaliteten. ElevenLabs insisterar på att det inte längre finns något behov av att kompromissa när de förbereder sig för att utrusta kreatörer och utgivare med de mest avancerade och mångsidiga AI-berättarverktygen.

“Plattformen vi lanserar nu handlar om att förvandla text till högkvalitativt talat ljud. Vi vill låta folk njuta av sin favoritbok eller nyhetsbrev genom att ge en röst åt alla författare, kreatörer och utvecklare som inte hade råd med en” - säger Mati Staniszewski, en medgrundare. “Vårt ultimata mål är att låta folk njuta av vilket innehåll de än finner relevant och intressant, oavsett vilket språk de talar” - tillägger Piotr Dabkowski, också en medgrundare.

På Credo Ventures strävar vi efter att arbeta med smarta och ambitiösa grundare från CEE-regionen. Vi såg hungern och gnistan i Matis och Piotrs ögon vid vårt allra första möte. Några månader senare håller de på att bli ett OpenAI-klassat forskningscentrum för röstteknologi som övervinner de största utmaningarna inom artificiellt ljud. Deras syntetiserade röster är redan omöjliga att skilja från verkliga och detta genombrott har inte bara kraftigt sänkt trösklarna för att generera innehåll i oöverträffad kvalitet och trohet, utan snart nog kommer det också att låta kreatörer radikalt expandera sina publik genom att bli flerspråkiga.– säger Maciek Gnutek, General Partner på Credo Ventures.

Trots att det är vanligt förekommande inom både underhållning och affärer, har ljud relativt försummats av de senaste framstegen inom forskning. Vi kunde inte vara mer exalterade över att stödja Mati & Piotr under denna gyllene era för generativ AI, och vi tror att ElevenLabs är teamet som kommer att föra denna teknologi till massorna, en röst i taget - säger Oliver Kicks, Principal på Concept Ventures.

Om ElevenLabs:
ElevenLabs är ett forskningsföretag som utvecklar AI-röstsyntes för kreatörer och förlag. Våra verktyg skapar otroligt naturtrogen tal och kan justera tonfall och betoning utifrån kontext eller instruktioner från användaren. Plattformen är byggd för att ge den kvalitet och flexibilitet som krävs för att vara en komplett lösning för att ge röst åt nyheter, nyhetsbrev, böcker och videor. Några av huvudfunktionerna är: textbaserad talgenerering, Voice Cloning,

Riskkapital tillhandahållet av Credo Ventures och Concept Ventures. Enskilda investerare inkluderar Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst och Harry Songhurst.

Kontakt
press@elevenlabs.io

Liknande artiklar

Skapa med AI-ljud av högsta kvalitet