ElevenLabs lämnar betafasen och lanserar Eleven Multilingual v2 – ett grundläggande AI-språkmodell för 30 språk

Publicerad: 22 aug. 2023

LyssnaLyssna på den här artikeln

0:00

0:000:00

ElevenLabs, plattformen för språklig AI, tar ett stort steg framåt i vårt mål att bryta språkbarriärer i innehåll genom att lansera en ny grundläggande deep learning-modell som stödjer flerspråkiga funktioner på 30 språk – Eleven Multilingual v2
Den här utvecklingen gör det möjligt för medieföretag, spelutvecklare, förlag och oberoende kreatörer över hela världen att göra sitt innehåll mycket mer tillgängligt
De här nya möjligheterna, som bygger vidare på flera nya funktioner och förbättringar sedan plattformens lansering i januari, markerar också det officiella slutet på företagets betafas
Vi på ElevenLabs vill göra allt innehåll tillgängligt på alla språk och med alla röster

London, Storbritannien– ElevenLabs, världsledande inom mjukvara för AI-baserad röstgenerering, lanserade idag en ny flerspråkig modell för röstgenerering, som kan skapa "emotionsrika" AI-ljud på 30 språk.

Utvecklingen, som bygger helt på vår egen forskning, gör det möjligt för utvecklare att skapa lokaliserat ljudinnehåll för internationella marknader i Europa, Asien och Mellanöstern. Under de senaste 18 månaderna har ElevenLabs analyserat mänskliga språkliga kännetecken, utvecklat nya sätt att förstå kontext och uttrycka känslor i röstgenerering, samt syntetiserat nya, unika röster.

Med Eleven Multilingual v2 kan den nya modellen automatiskt känna igen nästan 30 skriftspråk när du skriver in text i ElevenLabs Text to Speech och generera tal på dessa språk med en äkthet som aldrig tidigare uppnåtts.

Oavsett om du använder en syntetisk eller klonad röst bevaras talarens unika röstdrag på alla språk, inklusive den ursprungliga accenten. Det betyder att du kan använda samma röst för att skapa innehåll på 30 olika språk.

Den här lanseringen kommer efter att vi släppt Professional

praktiskt taget är omöjlig att skilja från originalet. Med dagens lansering kan din röst tala på nästan 30 språk som ingår i det flerspråkiga modellen.

De språk som stöds är:koreanska, nederländska, turkiska, svenska, indonesiska, vietnamesiska, filipino, ukrainska, grekiska, tjeckiska, finska, rumänska, danska, bulgariska, malajiska, ungerska, norska, slovakiska, kroatiska, arabiska (standard) och tamil. Dessa språk kompletterar de redan tillgängliga engelska, polska, tyska, spanska, franska, italienska, hindi och portugisiska.

Efter att ha lanserat nya funktioner och kontinuerligt förbättrat plattformen kan ElevenLabs idag också bekräfta att vi nu officiellt lämnat betafasen. Det här steget markerar en viktig milstolpe i vårt engagemang för att ge våra över 1 miljon användare världen över tillgång till pålitliga och moderna verktyg.

Framöver planerar ElevenLabs att lansera en funktion där användare kan dela sina röster på plattformen och dra nytta av utvecklingen av nytt ljudmaterial, för att främja samarbetet mellan människa och AI.

Mati Staniszewski, VD och grundare av ElevenLabs, säger:

”ElevenLabs grundades med drömmen om att göra allt innehåll tillgängligt på alla språk och med alla röster. Med lanseringen av Eleven Multilingual v2 har vi tagit ett steg närmare att förverkliga den drömmen och gör AI-röster i mänsklig kvalitet tillgängliga på varje dialekt.

Våra verktyg för röstsyntes öppnar nya möjligheter för alla kreatörer och ger dem högkvalitativa alternativ för röstsyntes. Nu gäller det även för flerspråkiga tillämpningar på nästan 30 språk. Vi hoppas att vi med hjälp av AI kan täcka ännu fler språk och röster och ta bort språkbarriärer för innehåll. Vi på ElevenLabs tror att ökad tillgänglighet leder till mer kreativitet, innovation och mångfald.”

ElevenLabs minskar kostnaderna och resurserna som krävs för att skapa högkvalitativt ljudinnehåll på flera språk. Företag och kreatörer kan därmed producera mer kreativa och lättillgängliga innehåll som når ut över kulturella och språkliga gränser.

Oberoende spelutvecklare och utgivare får med det flerspråkiga röstverktyget nya möjligheter att översätta spelupplevelser och ljudinnehåll för en internationell publik och kommunicera med spelare och lyssnare på deras eget språk – utan att kompromissa med kvalitet eller noggrannhet i rösten.

På samma sätt kan även utbildningsinstitutioner nu ge elever tillgång till exakt ljudinnehåll på målspråket direkt, för att förbättra språkförståelse och uttal samt möta olika undervisningsstilar och behov hos internationella studenter.

Kreatörer av alla slag kan använda ElevenLabs verktyg för att förbättra tillgängligheten till sitt innehåll för personer med synnedsättning eller särskilda inlärningsbehov, genom att komplettera visuellt innehåll med tal på flera språk.

Den första sviten av AI-röstverktyg, som lanserades i januari 2023, gör det möjligt att omvandla vilken text som helst till tal med hjälp av förinställda syntetiska röster eller genom att skapa en klon av din egen röst. Det flerspråkiga röstverktyget är ytterligare ett steg i ElevenLabs uppdrag att göra allt innehåll tillgängligt på alla språk och med alla röster.

Teknologin används redan i många kreativa branscher och sektorer. Den gör det möjligt för oberoende författare att skapa ljudböcker, ge biroller i dataspel röster, göra skriftligt onlineinnehåll tillgängligt för personer med synnedsättning och driva världens första AI-radiokanal. ElevenLabs samarbetar också med flera ledande innehållsskapare och studios, bland annat AI-videogeneratorn D-ID, Storytel, en av världens största ljudboksförlag, den öppna videoplattformen ScienceCast, vars videogenerator samlar vetenskapliga forskningsartiklar som publicerats på arXiv, världsledande plattform för innehållsskapande TheSoul Publishingfantastiska spelutvecklare som Embark Studiosoch Paradox Interactivesamt medieplattformen MNTN.

ElevenLabs lämnar betafasen och lanserar Eleven Multilingual v2 – ett grundläggande AI-språkmodell för 30 språk

Liknande artiklar

Vi presenterar Eleven Multilingual v1: Vår nya talsyntesmodell

Denna Röst Existerar Inte - Generativ Röst-AI

Den första AI:n som kan skratta

Röstkonvertering