Presenterar Eleven v3 Alpha

Prova v3

ElevenLabs lämnar betafasen och lanserar Eleven Multilingual v2 – en grundläggande AI-språkmodell för 30 språk

  • ElevenLabs, plattformen för språklig AI, tar ett stort steg framåt i sitt mål att övervinna språkbarriärer i innehåll genom att lansera en ny grundläggande deep learning-modell som stöder flerspråkiga funktioner på 30 språk – Eleven Multilingual v2
  • Denna utveckling kommer att göra det möjligt för medieföretag, spelutvecklare, förlag och oberoende författare världen över att drastiskt förbättra tillgängligheten av sitt innehåll
  • Dessa nya kapaciteter, som följer en rad nya funktioner och förbättringar sedan plattformens lansering i januari, markerar också det officiella slutet på företagets beta-fas
  • ElevenLabs har som mål att göra allt innehåll universellt tillgängligt på alla språk och med alla röster

London, Storbritannien ElevenLabs, världsledande inom programvara för artificiell röstigenkänning, har idag lanserat en ny flerspråkig modell för röstgenerering, som kan generera känslofyllda AI-ljudsignaler på 30 språk.

Utvecklingen, som är helt baserad på egen forskning, kommer att göra det möjligt för utvecklare att producera lokaliserat ljudinnehåll för internationella marknader i Europa, Asien och Mellanöstern. ElevenLabs har under de senaste 18 månaderna analyserat mänskliga språkmönster, utvecklat nya mekanismer för att förstå kontext och uttrycka känslor vid röstgenerering samt syntetiserat nya, unika röster.

Med Eleven Multilingual v2 kan den nya modellen automatiskt känna igen nästan 30 skriftspråk när text matas in i ElevenLabs Text to Speech-plattform och generera tal på dessa språk med en tidigare oöverträffad äkthet.

Oavsett om en syntetisk eller klonad röst används, bevaras talarens unika röstegenskaper på alla språk, inklusive den ursprungliga accenten. Det betyder att innehåll kan väckas till liv på 30 olika språk med samma röst.

Denna introduktion följer den offentliga lanseringen av Professional Voice Cloning för alla kreatörer på plattformen. Med denna produktuppdatering, som släpptes tillsammans med ytterligare säkerhetsfunktioner, kan användare skapa en perfekt digital kopia av sin egen röst, som

praktiskt taget är omöjlig att skilja från originalet. Med dagens lansering kan din röst tala på nästan 30 språk som finns tillgängliga inom det flerspråkiga modellen.

Bland de stödda språken finns: Koreanska, Nederländska, Turkiska, Svenska, Indonesiska, Vietnamesiska, Filippinska, Ukrainska, Grekiska, Tjeckiska, Finska, Rumänska, Danska, Bulgariska, Malaysiska, Ungerska, Norska, Slovakiska, Kroatiska, Modern standardarabiska och Tamil. Dessa språk kompletterar de redan tillgängliga språken Engelska, Polska, Tyska, Spanska, Franska, Italienska, Hindi och Portugisiska.

Efter introduktionen av nya funktioner och kontinuerliga förbättringar av plattformen har ElevenLabs idag också bekräftat att plattformen officiellt har lämnat beta-fasen. Denna övergång markerar ett avgörande ögonblick i företagets engagemang för att tillhandahålla sina mer än 1 miljon användare världen över pålitliga och toppmoderna verktyg.

För framtiden planerar ElevenLabs att införa en mekanism som gör det möjligt för användare att dela sina röster på plattformen och dra nytta av utvecklingen av nya ljuddata för att främja samarbetet mellan människa och AI.

Mati Staniszewski, VD och grundare av ElevenLabs, sa:

”ElevenLabs grundades med drömmen om att göra allt innehåll universellt tillgängligt på alla språk och med alla röster. Med lanseringen av Eleven Multilingual v2 har vi kommit ett steg närmare att förverkliga denna dröm och göra AI-röster av mänsklig kvalitet tillgängliga på varje dialekt.

Våra verktyg för röstsyntes banar väg för alla kreatörer och erbjuder dem högkvalitativa alternativ för röstsyntes. Dessa fördelar sträcker sig nu till flerspråkiga applikationer på nästan 30 språk. Slutligen hoppas vi, med hjälp av AI, kunna täcka ännu fler språk och röster och eliminera språkbarriärer för innehåll. Vi på ElevenLabs tror att dessa framsteg i tillgänglighet i slutändan kommer att leda till mer kreativitet, innovation och mångfald.”

ElevenLabs minskar kostnaderna och resurserna som krävs för att skapa högkvalitativt ljudinnehåll på flera språk. Företag och kreatörer kan därmed producera mer fantasifullt och lättillgängligt innehåll som tilltalar över kulturella och språkliga gränser.

För oberoende spelutvecklare och förlag erbjuder det flerspråkiga röstgenereringsverktyget nya möjligheter att översätta spelupplevelser och ljudinnehåll för en internationell publik och kommunicera med spelare och lyssnare på deras eget språk utan att kompromissa med kvalitet eller noggrannhet i röstutgången.

På liknande sätt har även utbildningsinstitutioner nu möjlighet att omedelbart tillhandahålla lärande med exakt ljudinnehåll på målspråket för att förbättra språkförståelse och uttal och möta de olika undervisningsstilar och inlärningsbehov hos internationella studenter.

Kreatörer av alla slag kan använda ElevenLabs verktyg för att förbättra tillgängligheten av sitt innehåll för personer med synnedsättningar eller ytterligare inlärningsbehov genom att berika visuellt innehåll med tal på flera språk.

Den första sviten av AI-röstverktyg, som presenterades i januari 2023, erbjuder möjligheten att omvandla vilken text som helst till tal, med hjälp av ett urval av fördefinierade syntetiska röster och möjligheten att skapa en klon av sin egen röst. Det flerspråkiga röstsyntesverktyget är ett ytterligare steg i ElevenLabs uppdrag att göra allt innehåll universellt tillgängligt på alla språk och med alla röster.

Tekniken används redan i en mängd kreativa branscher och sektorer. Den gör det möjligt för oberoende författare att skapa ljudböcker, ge röst åt sidokaraktärer i videospel, underlätta tillgången till skriftligt onlineinnehåll för personer med synnedsättningar och driva världens första AI-radiostation. ElevenLabs har också ingått partnerskap med ett antal ledande innehållsskapare och studior, inklusive AI-videogeneratorn D-ID, Storytel, en av världens största ljudboksförlag, den öppna videoplattformen ScienceCast, vars videogenereringsverktyg aggregerar vetenskapliga forskningsarbeten som publicerats på arXiv, den världsledande innehållsskapande plattformen TheSoul Publishing, fantastiska spelutvecklare som Embark Studios och Paradox Interactive och medieplattformen MNTN.

Utforska mer

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in