ElevenLabs kommer ut ur beta och släpper Eleven Multilingual v2 - en grundläggande AI-talmodell för nästan 30 språk

Avancemanget kommer att göra det möjligt för medieföretag, spelutvecklare, utgivare och oberoende kreatörer över hela världen att dramatiskt förbättra tillgängligheten för sitt innehåll.

  • Voice AI-plattform ElevenLabs tar ett radikalt steg framåt i sina ansträngningar att eliminera innehållets språkliga barriärer med lanseringen av en ny grundläggande djupinlärningsmodell som stöder flerspråkig förmåga 28+ språk de Eleven Multilingual v2
  • Avancemanget kommer att tillåta medieföretag, spelutvecklare, utgivare och oberoende kreatörer över hela världen att dramatiskt förbättra tillgängligheten för sitt innehåll
  • Dessa nya funktioner, som följer en rad nya funktioner och förbättringar sedan plattformen lanserades i januari, markerar också det officiella slutet av företagets betafas
  • ElevenLabs uppdrag är att göra allt innehåll universellt tillgängligt på alla språk och med vilken röst som helst

ElevenLabs, världsledande inom röst AI-mjukvara, har idag lanserat en ny flerspråkig röstgenereringsmodell kapabel att exakt producera "känslomässigt rikt" AI-ljud på nästan 30 språk.

Avancemanget, helt baserat på intern forskning, kommer att göra det möjligt för kreatörer att producera lokaliserat ljudinnehåll för internationella marknader i Europa, Asien och Mellanöstern. ElevenLabs har ägnat de senaste 18 månaderna åt att analysera markörerna för mänskligt tal, bygga nya mekanismer för att förstå sammanhang och förmedla känslor i talgenerering, samt syntetisera nya, unika röster.

Med Eleven Multilingual v2, när text matas in i ElevenLabs text till tal plattform, den nya modellen kan automatiskt identifiera nästan 30 skriftspråk och generera tal i dem med en aldrig tidigare skådad nivå av autenticitet.

Samtidigt, oavsett om en syntetisk röst eller klonad röst används, bibehålls talarens unika röstegenskaper över alla språk, inklusive deras ursprungliga accent. Det betyder att samma röst kan användas för att ge innehåll till liv på 28 olika språk.

Detta utrullningen följer det offentliga släppet av Professional Voice Cloning till alla skapare på plattformen. Denna produktuppdatering, som gjordes tillgänglig tillsammans med ytterligare säkerhets- och säkerhetsfunktioner, tillåter användare att skapa en perfekt digital kopia av sin egen röst; en som är praktiskt taget omöjlig att skilja från originalet. Dagens release innebär att din röst kommer att kunna tala över de nästan 30 språk som erbjuds av den flerspråkiga modellen.

Språk som stöds inkluderar nu; kinesiska, koreanska, holländska, turkiska, svenska, indonesiska, Filippinare, japanska, ukrainska, grekiska, tjeckiska, finska, rumänska, danska, bulgariska, malajiska, slovakiska, Kroatisk, Klassiker arabiska , och Tamil.

De ansluter sig till tidigare tillgängliga språk inklusive engelska, polska, tyska, spanska, franska, italienska, hindi , och portugisiska.

Efter senaste funktionslanseringar och pågående förbättringar av plattformen, har ElevenLabs också idag bekräftat att plattformen officiellt kommer från Beta. Denna övergång markerar ett avgörande ögonblick i företagets engagemang för att tillhandahålla tillförlitliga och banbrytande verktyg för sina över 1 miljon globala användare.

Framöver planerar ElevenLabs att introducera en mekanism som tillåter användare att dela röster på plattformen och dra nytta av utvecklingen av nytt ljud, vilket främjar möjligheter för samarbete mellan människa och AI.

Mati Staniszewski, VD och medgrundare av ElevenLabs, kommenterar:

ElevenLabs startades med drömmen om att göra allt innehåll universellt tillgängligt på alla språk och med vilken röst som helst. Med lanseringen av Eleven Multilingual v2 är vi ett steg närmare att göra denna dröm till verklighet och göra AI-röster av mänsklig kvalitet tillgängliga på alla dialekter.

"Våra verktyg för text-till-tal-generering hjälper till att jämna ut spelplanen och ger högkvalitativa talljudfunktioner till alla skapare där ute. Dessa fördelar sträcker sig nu till flerspråkiga applikationer på nästan 30 språk. Så småningom hoppas vi kunna täcka ännu fler språk och röster med hjälp av AI, och eliminera de språkliga barriärerna för innehåll. På ElevenLabs tror vi att dessa steg i tillgänglighet i slutändan kommer att främja större kreativitet, innovation och mångfald.

Genom att sänka kostnaden och resurserna som behövs för att skapa högkvalitativt ljudinnehåll på flera språk, gör ElevenLabs det möjligt för företag och kreatörer att producera mer fantasifullt och tillgängligt innehåll som resonerar över kulturer och språk.

Om du använder oberoende spelutvecklare och utgivare, ger det flerspråkiga verktyget för talgenerering nya möjligheter att översätta spelupplevelser och ljudinnehåll för internationella publiker, för att få kontakt med spelare och lyssnare på deras egna språk utan att kompromissa med kvaliteten eller noggrannheten hos det talade ljudet.

Liknande, utbildningsinstitutioner har nu möjlighet att ge eleverna korrekt ljudinnehåll på målspråk omedelbart, vilket stärker språkförståelse och uttalsförmåga, samt tillgodose olika undervisningsstilar och inlärningsbehov för internationella studenter.

Skapare av alla slag kan använda ElevenLabs verktyg för att förbättra innehållet Tillgänglighet: för personer med synnedsättning eller ytterligare inlärningsbehov genom att komplettera visuellt innehåll med tal tillgängligt på flera språk.

Dess första svit med AI-röstverktyg som presenterades i januari 2023 inkluderade möjligheten att förvandla vilken text som helst till tal via ett urval av fördesignade, syntetiska röster och möjligheten att skapa en klon av din egen röst. Det flerspråkiga talsyntesverktyget är ytterligare ett steg framåt i ElevenLabs uppdrag att göra allt innehåll universellt tillgängligt på alla språk och med vilken röst som helst.

Tekniken har redan omfattats av flera kreativa vertikaler och sektorer, inklusive att göra det möjligt för indieförfattare att skapa ljudböcker, uttrycka sekundära karaktärer i videospel, stödja synskadade att få tillgång till skriftligt innehåll online och driva världens första AI-radiokanal. ElevenLabs har också samarbetat med en rad ledande innehållsskapare och studior, inklusive AI-videogeneratorer D-ID, ett av världens största ljudboksförlag Storytel, vetenskapsvideoplattform med öppen tillgång ScienceCast vars videogenereringsverktyg kondenserar vetenskapliga forskningsartiklar publicerade om arXiv, ledande global plattform för innehållsskapare TheSoul Publishing, otroliga spelutvecklare gillar Embark Studios , och Paradox Interactive, och medieplattformen MNTN.

Kontakta
press@elevenlabs.io

Utforska mer

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in