
ElevenLabs lämnar betafasen och lanserar Eleven Multilingual v2: en grundläggande AI-röstmodell för 30 språk
- AI-röstplattformenElevenLabstar ett stort steg framåt i sina ansträngningar att eliminera språkbarriärer i innehåll, med lanseringen av en ny djupinlärningsmodell som stöder flerspråkiga funktioner på 30 språk:Eleven Multilingual v2
- Denna utveckling kommer att göra det möjligt för medieföretag, spelutvecklare, förlag och oberoende skapare världen över att avsevärt förbättra tillgängligheten av sitt innehåll
- Dessa nya funktioner, som följer en rad nyheter och förbättringar sedan plattformens lansering i januari, markerar också det officiella slutet på företagets betafas
- ElevenLabs uppdrag är att göra allt innehåll universellt tillgängligt på vilket språk som helst och med vilken röst som helst
London, Storbritannien-ElevenLabs,världsledande inom AI-röstprogramvara, lanserade idag en ny flerspråkig röstgenereringsmodellsom kan producera AI-ljud med "rika känslor" på 30 språk.
Denna framsteg, helt baserad på intern forskning, kommer att göra det möjligt för skapare att producera lokaliserat ljudinnehåll för internationella marknader i Europa, Asien och Mellanöstern. ElevenLabs har under de senaste 18 månaderna analyserat mänskligt tal, skapat nya mekanismer för att förstå kontext och förmedla känslor i talgenerering, samt syntetiserat nya och unika röster.
Med Eleven Multilingual v2, när en text matas in i ElevenLabs röstsyntesplattform,kan den nya modellen automatiskt identifiera nästan 30 skrivna språk och generera tal med en oöverträffad nivå av äkthet.
Dessutom, oavsett om det är en syntetisk röst eller en klonad röst, bevaras talarens unika röstegenskaper på alla språk, inklusive dess ursprungliga accent. Således kan samma röst användas för att ge liv åt innehåll på 30 olika språk.
Dennalansering följerlanseringen av professionell röstkloning för alla skapare på plattformen. Denna produktuppdatering, som lanserades samtidigt som ytterligare säkerhetsfunktioner, gör det möjligt för användare att skapa en perfekt digital kopia av sin egen röst; som är praktiskt taget
omöjlig att skilja från originalet. Med denna nya version kan din röst uttrycka sig på de cirka 30 språk som erbjuds av den flerspråkiga modellen.
De språk som stöds inkluderar:koreanska, nederländska, turkiska, svenska, indonesiska, vietnamesiska, filippinska, ukrainska, grekiska, tjeckiska, finska, rumänska, danska, bulgariska, malaysiska, ungerska, norska, slovakiska, kroatiska, klassisk arabiska och tamil. Dessa ansluter sig till de tidigare tillgängliga språken, inklusive engelska, polska, tyska, spanska, franska, italienska, hindi och portugisiska.
Efter de senaste lanseringarna av funktioner och kontinuerliga förbättringar av plattformen, bekräftade ElevenLabs idag också att plattformen officiellt lämnar sin betafas. Denna övergång markerar en vändpunkt i företagets engagemang för att tillhandahålla pålitliga och avancerade verktyg till sina över en miljon användare världen över.
Framöver planerar ElevenLabs att införa en mekanism som gör det möjligt för användare att dela sina röster på plattformen och dra nytta av utvecklingen av nya ljud, vilket främjar möjligheterna till samarbete mellan människa och artificiell intelligens.
Mati Staniszewski, VD och medgrundare av ElevenLabs, kommenterar:
”ElevenLabs skapades med målet att göra allt innehåll universellt tillgängligt på vilket språk som helst och med vilken röst som helst. Med lanseringen av Eleven Multilingual v2 kommer vi ett steg närmare vårt mål, som är att göra denna dröm till verklighet och tillhandahålla AI-röster av mänsklig kvalitet på alla dialekter.
”Våra röstsyntesverktyg gör det möjligt för alla att stå på samma nivå och erbjuda alla skapare överlägsna röstljudmöjligheter. Dessa fördelar sträcker sig nu till flerspråkiga applikationer på nästan 30 språk. På sikt hoppas vi täcka ännu fler språk och röster med hjälp av AI, och eliminera språkbarriärer i innehåll. På ElevenLabs tror vi att dessa framsteg inom tillgänglighet i slutändan kommer att främja kreativitet, innovation och mångfald.”
Genom att minska kostnaderna och resurserna som krävs för att skapa högkvalitativt ljudinnehåll på flera språk, gör ElevenLabs det möjligt för företag och skapare att producera mer fantasifullt och tillgängligt innehåll som tar hänsyn till alla kulturer och språk.
Förutvecklare och oberoende spelutgivare, gör det flerspråkiga röstgenereringsverktyget det möjligt att översätta spelupplevelser och ljudinnehåll för internationella publiker, och skapa en koppling till spelare och lyssnare på deras eget språk utan att kompromissa med kvaliteten eller noggrannheten i det talade ljudet.
På samma sätt,utbildningsinstitutionerhar nu möjlighet att omedelbart tillhandahålla eleverna exakt ljudinnehåll på målspråken, vilket stärker färdigheter i språkförståelse och uttal och möter olika undervisningsstilar och inlärningsbehov hos internationella studenter.
Skapare av alla slag kan använda ElevenLabs verktyg för att förbättratillgänglighetenav innehåll för personer med synnedsättningar eller med ytterligare inlärningsbehov, genom att komplettera visuellt innehåll med tal tillgängligt på flera språk.
Dess första uppsättning AI-röstverktyg, som presenterades i januari 2023, inkluderade möjligheten att omvandla vilken text som helst till tal med hjälp av ett urval av fördesignade syntetiska röster och möjligheten att skapa en klon av din egen röst. Det flerspråkiga röstsyntesverktyget är ett nytt steg i ElevenLabs uppdrag att göra allt innehåll universellt tillgängligt på vilket språk som helst och med vilken röst som helst.
Tekniken har redan antagits inom många sektorer och kreativa vertikaler, inklusive att göra det möjligt för oberoende författare att skapa ljudböcker, ge röst åt biroller i videospel, hjälpa synskadade att få tillgång till skriftligt innehåll online och driva världens första AI-radiokanal. ElevenLabs har också samarbetat med en rad ledande innehållsskapare och studior, inklusive AI-videogeneratorernaD-ID, en av världens största ljudboksutgivare, Storytel,den öppna vetenskapsvideoplattformenScienceCastvars videogenereringsverktyg samlar vetenskapliga forskningsdokument publicerade påarXiv,den ledande globala innehållsskapande plattformenTheSoul Publishing,fantastiska spelutvecklare somEmbark StudiosochParadox Interactive,och multimediaplattformenMNTN.
Utforska mer


Dubbing made simpler, sharper, and faster at PERSO.ai
ESTsoft and ElevenLabs partner to bring natural voiceovers and frame-accurate lip-sync to global video localization.