ElevenLabs lämnar beta-fasen och lanserar Eleven Multilingual v2, en AI-konversationsmodell på 30 språk

Publicerad: 22 aug. 2023

LyssnaLyssna på den här artikeln

0:00

0:000:00

AI-röstplattformen ElevenLabstar ett stort steg framåt i sina ansträngningar att eliminera språkbarriärer i olika innehåll med lanseringen av en ny djupinlärningsmodell, som erbjuder flerspråkiga funktioner på 30 språk: Eleven Multilingual v2.
Denna utveckling gör det möjligt för medier, spelutvecklare, förlag och oberoende skapare världen över att dramatiskt förbättra tillgängligheten till sina innehåll.
Dessa nya funktioner, som kommer efter en rad funktionslanseringar och förbättringar sedan plattformen lanserades i januari, markerar också officiellt slutet på företagets "beta"-fas.
ElevenLabs mål är att göra allt innehåll universellt tillgängligt, på vilket språk som helst och med vilken röst som helst.

London, Storbritannien - ElevenLabs, världsledande inom AI-röstprogramvara, har idag lanserat en ny flerspråkig röstgenereringsmodell på 30 språk, som kan producera exakt AI-genererat ljud med "emotionell rikedom".

Denna utveckling, helt baserad på intern forskning, gör det möjligt för skapare att producera lokaliserat ljudinnehåll för internationella marknader i Europa, Asien och Mellanöstern. ElevenLabs har ägnat de senaste 18 månaderna åt att analysera mänskliga talmarkörer, vilket har gjort det möjligt att skapa nya mekanismer för att förstå kontext och förmedla känslor i talgenerering samt syntetisera nya och unika röster.

Med Eleven Multilingual v2, när du matar in text i ElevenLabs Text to Speech-plattform, kan den nya modellen automatiskt identifiera cirka 30 språk och generera röst med en oöverträffad äkthet.

Samtidigt, oavsett om du använder en syntetisk röst eller en klonad röst, bevaras talarens unika röstegenskaper på alla språk, inklusive deras ursprungliga accent. Det betyder att samma röst kan användas för att ge liv åt innehåll på 30 olika språk.

Denna lansering kommer efter Professional-publiceringen

De stödda språken inkluderar koreanska, nederländska, turkiska, svenska, indonesiska, vietnamesiska, filippinska, ukrainska, grekiska, tjeckiska, finska, rumänska, danska, bulgariska, malaysiska, ungerska, norska, slovakiska, kroatiska, klassisk arabiska och tamil. Dessa ansluter sig till de tidigare tillgängliga språken, inklusive engelska, polska, tyska, spanska, franska, italienska, hindi och portugisiska.

Efter de senaste lanseringarna av nya funktioner, och med de kontinuerliga förbättringarna av plattformen, har ElevenLabs också bekräftat idag att plattformen officiellt lämnar "beta"-fasen. Denna övergång markerar ett avgörande ögonblick i företagets engagemang: att tillhandahålla pålitliga och avancerade verktyg till sina över 1 miljon globala användare.

Framöver planerar ElevenLabs att införa en mekanism som gör det möjligt för användare att dela röster på plattformen och dra nytta av utvecklingen av nya ljudfiler, vilket skulle främja samarbetsmöjligheter mellan människor och AI.

Mati Staniszewski, VD och medgrundare av ElevenLabs, kommenterar:

«ElevenLabs föddes med drömmen om att göra allt innehåll universellt tillgängligt, på vilket språk som helst och med vilken röst som helst. Med lanseringen av Eleven Multilingual v2 är vi ett steg närmare att förverkliga den drömmen och göra AI-skapade röster av mänsklig kvalitet tillgängliga på alla dialekter».

«Våra verktyg för "text till tal" bidrar till lika möjligheter och erbjuder högkvalitativa talade ljudfunktioner till alla skapare. Dessa fördelar sträcker sig nu till flerspråkiga applikationer på nästan 30 språk. Med tiden hoppas vi omfatta ännu fler språk och röster med hjälp av AI, och eliminera språkbarriärer i innehåll. På ElevenLabs tror vi att dessa framsteg i tillgänglighet i slutändan kommer att främja större kreativitet, innovation och mångfald».

Genom att minska kostnaderna och resurserna som krävs för att skapa högkvalitativt ljudinnehåll på flera språk, gör ElevenLabs det möjligt för företag och skapare att producera mer fantasifullt och tillgängligt innehåll i alla kulturer och språk.

För oberoende spelutvecklare och förlag, erbjuder det flerspråkiga röstgenereringsverktyget nya möjligheter att översätta spelupplevelser och ljudinnehåll för internationella publiker, vilket kopplar samman med spelare och lyssnare på deras egna språk utan att kompromissa med kvaliteten eller noggrannheten i det talade ljudet.

På samma sätt, har utbildningsinstitutioner nu medel för att omedelbart tillhandahålla sina studenter exakt ljudinnehåll på målspråken, vilket stärker förståelse- och uttalsfärdigheter i olika språk, samt tillgodoser olika undervisningsstilar och inlärningsbehov hos studenter världen över.

Alla typer av skapare kan använda ElevenLabs verktyg för att förbättra tillgängligheten till sina innehåll för personer med synnedsättning eller ytterligare inlärningsbehov, så att visuellt innehåll kompletteras med ljud tillgängligt på flera språk.

Den ursprungliga uppsättningen av AI-röstverktyg, presenterad i januari 2023, inkluderade möjligheten att konvertera vilken text som helst till röst tack vare ett urval av fördesignade syntetiska röster och möjligheten att skapa en klon av användarens röst. Det flerspråkiga röstsyntesverktyget är ett steg närmare ElevenLabs mål att göra allt innehåll universellt tillgängligt, på vilket språk som helst och med vilken röst som helst.

Denna teknik har redan antagits i flera vertikaler och kreativa sektorer, vilket har gjort det möjligt för oberoende författare att skapa ljudböcker, ge röst åt biroller i videospel, stödja personer med synnedsättning att få tillgång till skriftligt innehåll online och till och med aktivera världens första AI-radiokanal. ElevenLabs har samarbetat med några av de främsta studiorna och innehållsskaparna, som AI-videogeneratorerna D-ID, en av världens största ljudboksförlag, Storytel, den öppna vetenskapliga videoplattformen ScienceCast, vars videogenereringsverktyg kondenserar vetenskapliga forskningsarbeten publicerade på arXiv, världens ledande innehållsskapande plattform, TheSoul Publishing, utvecklarna av några av de mest fantastiska spelen, som Embark Studios och Paradox Interactive, och medieplattformen MNTN.

Liknande artiklar

ElevenLabs kommer ut ur beta och släpper Eleven Multilingual v2 - en grundläggande AI-talmodell för nästan 30 språk
Kategori
Forskning
Datum
22 aug. 2023
ElevenLabs lanserar Eleven Multilingual v2, en grundläggande AI-röstmodell för 30 språk i betaversion
Kategori
Forskning
Datum
22 aug. 2023
ElevenLabs lämnar betafasen och lanserar Eleven Multilingual v2 – ett grundläggande AI-språkmodell för 30 språk
Kategori
Forskning
Datum
22 aug. 2023
ElevenLabs lämnar betaversionen och lanserar Eleven Multilingual v2 - en AI-baserad talmodell för 30 språk
Kategori
Forskning
Datum
22 aug. 2023

Skapa med AI-ljud av högsta kvalitet

Prata med försäljning Registrera dig

Liknande artiklar

ElevenLabs kommer ut ur beta och släpper Eleven Multilingual v2 - en grundläggande AI-talmodell för nästan 30 språk

ElevenLabs lanserar Eleven Multilingual v2, en grundläggande AI-röstmodell för 30 språk i betaversion

ElevenLabs lämnar betafasen och lanserar Eleven Multilingual v2 – ett grundläggande AI-språkmodell för 30 språk

ElevenLabs lämnar betaversionen och lanserar Eleven Multilingual v2 - en AI-baserad talmodell för 30 språk