ElevenLabs wychodzi z wersji beta i wydaje Eleven Multilingual v2 — podstawowy model mowy AI dla prawie 30 języków

Dzięki temu postępowi firmy medialne, twórcy gier, wydawcy i niezależni twórcy na całym świecie będą mogli znacząco poprawić dostępność swoich treści.

  • Platforma sztucznej inteligencji głosowej ElevenLabs podejmuje radykalny krok naprzód w swoich wysiłkach na rzecz wyeliminowania barier językowych w treściach, udostępniając nowy podstawowy model głębokiego uczenia się, obsługujący wielojęzyczne możliwości w ponad 28 ten Jedenaście wielojęzycznych v2
  • Dzięki temu postępowi firmy medialne, twórcy gier, wydawcy i niezależni twórcy na całym świecie będą mogli znacząco zwiększyć dostępność swoich treści
  • Te nowe możliwości, które następują po serii nowych funkcji i udoskonaleń wprowadzonych od czasu uruchomienia platformy w styczniu, oznaczają również oficjalne zakończenie fazy beta firmy
  • Misją ElevenLabs jest zapewnienie powszechnego dostępu do wszystkich treści w dowolnym języku i dowolnym głosem

ElevenLabs, światowy lider w dziedzinie oprogramowania AI głosowego, wprowadził dziś na rynek nowy wielojęzyczny model generowania głosu zdolny do dokładnego odtwarzania „bogatego emocjonalnie” dźwięku AI w blisko 30 językach.

Postęp ten, oparty całkowicie na wewnętrznych badaniach, umożliwi twórcom produkcję zlokalizowanych treści audio na rynki międzynarodowe w Europie, Azji i na Bliskim Wschodzie. Przez ostatnie 18 miesięcy ElevenLabs zajmowało się analizą markerów ludzkiej mowy, opracowywaniem nowych mechanizmów rozumienia kontekstu i przekazywania emocji podczas generowania mowy, a także syntezą nowych, unikalnych głosów.

W przypadku Eleven Multilingual v2 po wprowadzeniu tekstu do ElevenLabs Text to Speech platforma, Nowy model potrafi automatycznie rozpoznawać blisko 30 języków pisanych i generować mowę w tych językach z niespotykanym dotąd poziomem autentyczności.

Jednocześnie niezależnie od tego, czy używany jest głos syntetyczny czy klonowany, unikalne cechy głosu mówcy są zachowywane we wszystkich językach, łącznie z jego oryginalnym akcentem. Oznacza to, że ten sam głos może ożywić treść w 28 różnych językach.

Ten Następuje wdrożenie publiczne wydanie Profesjonalne klonowanie głosu do wszystkich twórców na platformie. Ta aktualizacja produktu, udostępniona wraz z dodatkowymi funkcjami bezpieczeństwa, umożliwia użytkownikom stworzenie idealnej cyfrowej kopii własnego głosu; takiej, która będzie praktycznie nieodróżnialna od oryginału. Dzisiejsza premiera oznacza, że będziesz mógł mówić w prawie 30 językach oferowanych przez wielojęzyczny model.

Obecnie obsługiwane języki obejmują: chiński, koreański, Holenderski, turecki, szwedzki, indonezyjski, Filipiński, japoński, ukraiński, grecki, czeski, fiński, rumuński, duński, bułgarski, malajski, słowacki, chorwacki, Klasyczny arabski i Tamil.

Dołączają do wcześniej dostępnych języków w tym angielski, Polski, niemiecki, hiszpański, francuski, włoski, hinduski i portugalski.

Po niedawnym wprowadzeniu nowych funkcji i ciągłym udoskonalaniu platformy, firma ElevenLabs potwierdziła dziś, że platforma oficjalnie wychodzi z fazy beta. Zmiana ta stanowi kluczowy moment w dążeniu firmy do dostarczania niezawodnych i najnowocześniejszych narzędzi dla ponad miliona użytkowników na całym świecie.

Myśląc o przyszłości, ElevenLabs planuje wprowadzić mechanizm, który umożliwi użytkownikom dzielenie się głosami na platformie i korzystanie z rozwoju nowych technologii audio, co stworzy możliwości współpracy człowieka i sztucznej inteligencji.

Mati Staniszewski, dyrektor generalny i współzałożyciel ElevenLabs, komentuje:

Powstanie ElevenLabs było odpowiedzią na marzenie o powszechnym dostępie do wszystkich treści w każdym języku i każdym głosem. Dzięki wydaniu Eleven Multilingual v2 jesteśmy o krok bliżej urzeczywistnienia tego marzenia i udostępnienia głosów sztucznej inteligencji o jakości ludzkiej w każdym dialekcie.

„Nasze narzędzia do generowania tekstu na mowę pomagają wyrównać szanse i zapewnić twórcom najwyższej jakości możliwości odtwarzania dźwięku mówionego. Korzyści te obejmują teraz aplikacje wielojęzyczne w prawie 30 językach. Mamy nadzieję, że z czasem dzięki sztucznej inteligencji uda nam się objąć jeszcze większą liczbę języków i głosów oraz wyeliminować bariery językowe w dostępie do treści. W ElevenLabs wierzymy, że te postępy w zakresie dostępności ostatecznie wspomogą większą kreatywność, innowacyjność i różnorodność.

Obniżając koszty i zasoby potrzebne do tworzenia wysokiej jakości treści audio w wielu językach, ElevenLabs umożliwia firmom i twórcom produkcję bardziej pomysłowych i przystępnych treści, które trafią do odbiorców w różnych kulturach i językach.

Aby uzyskać niezależni twórcy i wydawcy gierNarzędzie do generowania mowy wielojęzycznej zapewnia nowe możliwości tłumaczenia doświadczeń z gier i treści audio dla odbiorców z całego świata, umożliwiając komunikację z graczami i słuchaczami w ich własnych językach bez uszczerbku dla jakości lub dokładności przekazu audio.

Podobnie, instytucje edukacyjne dysponujemy teraz środkami umożliwiającymi natychmiastowe zapewnienie uczniom dokładnych treści audio w językach docelowych, wspomagając ich rozumienie języka i umiejętności wymowy, a także dostosowując się do różnych stylów nauczania i potrzeb edukacyjnych studentów zagranicznych.

Twórcy wszelkiego typu mogą używać narzędzia ElevenLabs do ulepszania treści Dostępność: dla osób z dysfunkcją wzroku lub dodatkowymi potrzebami edukacyjnymi poprzez uzupełnienie treści wizualnych o treści mówione dostępne w wielu językach.

Pierwszy zestaw narzędzi głosowych opartych na sztucznej inteligencji, zaprezentowany w styczniu 2023 r., obejmował możliwość przekształcania dowolnego tekstu w mowę za pomocą wybranych wstępnie zaprojektowanych, syntetycznych głosów, a także możliwość stworzenia klonu własnego głosu. Narzędzie do syntezy mowy wielojęzycznej stanowi kolejny krok naprzód w realizacji misji ElevenLabs, której celem jest zapewnienie powszechnego dostępu do wszelkich treści w dowolnym języku i każdym głosem.

Technologia ta została już wdrożona w wielu kreatywnych pionach i sektorach, m.in. umożliwiając niezależnym autorom tworzenie audiobooków, użyczając głosu postaciom drugoplanowym w grach wideo, pomagając osobom niedowidzącym w dostępie do treści pisemnych online oraz wspierając pierwszy na świecie kanał radiowy oparty na sztucznej inteligencji. ElevenLabs nawiązało również współpracę z szeregiem wiodących twórców treści i studiów, w tym z generatorami wideo opartymi na sztucznej inteligencji ZROBIŁ, jeden z największych na świecie wydawców audiobooków Storytel, platforma wideo o otwartym dostępie do nauki NaukaCast którego narzędzie do generowania filmów wideo kondensuje prace naukowe opublikowane na arXiv, wiodąca globalna platforma twórców treści Wydawnictwo TheSoul, niesamowici twórcy gier, tacy jak Studia Embark i Paradox Interactive, i platforma medialna MNTN-Y

Kontakt
prasa@elevenlabs.io

Odkryj więcej

ElevenLabs

Twórz przy użyciu technologii audio AI zapewniającej najwyższą jakość