
Dubbing made simpler, sharper, and faster at PERSO.ai
ESTsoft and ElevenLabs partner to bring natural voiceovers and frame-accurate lip-sync to global video localization.
Presenterar Eleven v3 Alpha
Prova v3London, Storbritannien - ElevenLabs,ElevenLabsvärldsledande inom AI-ljudprogramvara, lanserade idag en ny flerspråkig röstgenereringsmodell som kan producera AI-röster med exakt "emotionell rikedom" på 30 språk.
Framsteget, som helt bygger på intern forskning, kommer att låta kreatörer producera lokalt ljudinnehåll för internationella marknader i hela Europa, Asien och Mellanöstern. ElevenLabs har under de senaste arton månaderna analyserat mänskliga talmönster, byggt nya mekanismer för att förstå kontext och förmedla känslor i talgenerering, samt skapat nya och unika röster.
Den nya Eleven Multilingual v2-modellen, när text matas in i ElevenLabs Text to Speech-plattform, kan automatiskt identifiera och generera tal på nästan 30 skrivna språk med en oöverträffad nivå av äkthet.
Samtidigt, oavsett om rösten som används är en AI-röst eller en klonad röst, kommer talarens unika röstegenskaper att bevaras över alla språk, inklusive deras ursprungliga accent. Detta innebär att samma röst kan användas för att ge liv åt innehåll på 30 olika språk.
Denna lansering följerden allmänna lanseringen av professionell röstkloning för alla innehållsskapare på plattformen. Denna produktuppdatering, som släpptes tillsammans med ytterligare säkerhetsfunktioner, låter användare skapa en perfekt digital kopia av sin röst; en virtuell version
som är omöjlig att skilja från originalet. Dagens lansering innebär att din röst nu kan tala på nästan 30 språk som erbjuds av den flerspråkiga modellen.
De stödda språken inkluderar koreanska, nederländska, turkiska, svenska, indonesiska, vietnamesiska, filippinska, ukrainska, grekiska, tjeckiska, finska, rumänska, danska, bulgariska, malaysiska, ungerska, norska, slovakiska, kroatiska, klassisk arabiska och tamil. Dessa har lagts till de tidigare tillgängliga språken inklusive engelska, polska, tyska, spanska, franska, italienska, hindi och portugisiska.
Efter lanseringen av de senaste funktionerna och de kontinuerliga förbättringarna av plattformen, bekräftade ElevenLabs idag att plattformen officiellt kommer att lämna betaversionen. Denna övergång markerar en avgörande stund i företagets engagemang för att tillhandahålla pålitliga och avancerade verktyg till sina över en miljon globala användare.
Med framtiden i sikte planerar ElevenLabs att erbjuda en mekanism som låter användare dela röster på plattformen och dra nytta av utvecklingen av nya röster, vilket främjar samarbete mellan människa och AI.
Mati Staniszewski, VD och medgrundare av ElevenLabs, kommenterade:
"ElevenLabs började med en dröm om att göra allt innehåll globalt tillgängligt på vilket språk som helst och med vilken röst som helst. Lanseringen av Eleven Multilingual v2 har låtit oss komma ett steg närmare att förverkliga denna dröm och göra AI-röster av mänsklig kvalitet tillgängliga på alla dialekter.
"Våra verktyg för text-till-tal hjälper till att skapa lika möjligheter och erbjuder högkvalitativa talade röstfunktioner för alla innehållsskapare. Dessa fördelar sträcker sig nu till flerspråkiga applikationer på nästan 30 språk. Vi hoppas slutligen kunna täcka fler språk och röster med hjälp av AI, och ta bort språkbarriärer för innehåll. Vi på ElevenLabs tror att dessa framsteg i tillgänglighet i slutändan kommer att främja mer kreativitet, innovation och mångfald."
Genom att sänka kostnaden och resurserna som krävs för att skapa högkvalitativt ljudinnehåll på flera språk, ger ElevenLabs företag och kreatörer möjlighet att producera mer kreativt och tillgängligt innehåll som resonerar över kulturer och språk.
Det flerspråkiga talgenereringsverktyget erbjuder spelutvecklare och oberoende förlag nya möjligheter att översätta spelupplevelser och ljudinnehåll för internationella publik, och kommunicera med spelare och lyssnare på deras egna språk utan att kompromissa med kvaliteten eller noggrannheten i det talade ljudet.
På samma sätt har utbildningsinstitutioner nu medel för att omedelbart förse elever med exakt ljudinnehåll på målspråken, vilket förbättrar språkförståelse och uttal, samt tillgodoser olika undervisningsmetoder och inlärningsbehov för internationella studenter.
Kreatörer av alla slag kan använda ElevenLabs verktyg för att förbättra tillgängligheten till innehåll för personer med synnedsättningar eller ytterligare inlärningsbehov genom att komplettera visuellt innehåll med tal tillgängligt på flera språk.
Den ursprungliga uppsättningen av AI-ljudverktyg som avslöjades i januari 2023 inkluderade möjligheten att omvandla vilken text som helst till tal via ett urval av fördesignade syntetiska röster och möjligheten att skapa en kopia av din egen röst. Det flerspråkiga talgenereringsverktyget är ytterligare ett steg framåt i ElevenLabs uppdrag att göra allt innehåll globalt tillgängligt på vilket språk som helst och med vilken röst som helst.
Många sektorer och kreativa områden har redan anammat denna teknik, inklusive att möjliggöra för oberoende författare att skapa ljudböcker, ge röst åt biroller i videospel, stödja synskadade att få tillgång till skriftligt innehåll online, och driva världens första AI-radiokanal. ElevenLabs har också samarbetat med en rad ledande innehållsskapare och studior, inklusive AI-videogeneratorer D-ID, en av världens största ljudboksförlag Storytel, den öppna vetenskapsvideoplattformen ScienceCast som kondenserar forskningsartiklar publicerade på arXiv, den ledande globala innehållsskaparplattformen TheSoul Publishing, och fantastiska spelutvecklare som Embark Studios och Paradox Interactive, samt medieplattformen MNTN.
ESTsoft and ElevenLabs partner to bring natural voiceovers and frame-accurate lip-sync to global video localization.
To celebrate 1 million agents created, build the best agent you can in 2 hours and compete for $20k+ in prizes.