ElevenLabs wychodzi z wersji beta i wprowadza Eleven Multilingual v2, podstawowy model AI głosu w 30 językach

  • Platforma AI audioElevenLabs to nowy model głębokiego uczenia z obsługą wielojęzyczną w 30 językachEleven Multilingual v2został wydany. To ogromny krok w eliminacji barier językowych w treściach.
  • Dzięki temu postępowi, media, deweloperzy gier, wydawcy i niezależni twórcy na całym świecie mogą znacznie poprawić dostępność swoich treści.
  • Od styczniowego uruchomienia platformy, ta nowa funkcja kończy oficjalnie fazę beta, po serii nowych funkcji i ulepszeń.
  • Misją ElevenLabs jest uczynienie wszystkich treści uniwersalnie dostępnymi w każdym języku i głosie

Londyn, Wielka BrytaniaLondyn, Wielka Brytania- światowy lider w dziedzinie oprogramowania AI audioElevenLabsogłosiłnowy model wielojęzycznego generowania głosu, który potrafi tworzyć "emocjonalne" głosy AI w 30 językach.

Ten postęp opiera się na badaniach wewnętrznych, umożliwiając twórcom tworzenie lokalizowanych treści głosowych dla rynków międzynarodowych w Europie, Azji i na Bliskim Wschodzie. ElevenLabs analizował markery ludzkiej mowy przez 18 miesięcy, budując nowe mechanizmy dla zrozumienia kontekstu, emocjonalnej ekspresji w generowaniu głosu i tworzenia unikalnych głosów.

Korzystając z Eleven Multilingual v2, wystarczy wprowadzić tekst na platformie ElevenLabs, anowy model automatycznie rozpozna około 30 języków pisanych i wygeneruje głos z niespotykaną dotąd wiarygodnością.

Jednocześnie, niezależnie od tego, czy używany jest głos syntetyczny czy klonowany, unikalne cechy głosu mówcy i akcenty są zachowane we wszystkich językach. Oznacza to, że można użyć tego samego głosu, aby ożywić treści w 30 różnych językach.

Po tymwdrożeniu profesjonalne klonowanie głosu zostało udostępnione na platformie. Ta aktualizacja produktu została wydana z dodatkowymi funkcjami bezpieczeństwa, umożliwiając użytkownikom tworzenie idealnej cyfrowej kopii swojego głosu.

Nie można odróżnić jej od oryginalnego głosu. Dzisiejsza premiera oznacza, że możesz mówić w prawie 30 językach oferowanych przez model wielojęzyczny, używając swojego głosu.

Obsługiwane języki: koreański, niderlandzki, turecki, szwedzki, indonezyjski, wietnamski, filipiński, ukraiński, grecki, czeski, fiński, rumuński, duński, bułgarski, malajski, węgierski, norweski, słowacki, chorwacki, klasyczny arabski, tamilski. Wszystkie te języki dołączyły do wcześniej dostępnych: angielskiego, polskiego, niemieckiego, hiszpańskiego, francuskiego, włoskiego, hindi, portugalskiego.

Po ostatnich wydaniach funkcji i ciągłych ulepszeniach platformy, ElevenLabs ogłasza dziś, że platforma oficjalnie wychodzi z wersji beta. To ważny moment w naszym zaangażowaniu w dostarczanie niezawodnych, nowoczesnych narzędzi dla ponad miliona użytkowników na całym świecie.

W przyszłości ElevenLabs planuje wprowadzić mechanizmy umożliwiające użytkownikom dzielenie się głosami na platformie, czerpanie korzyści z nowych rozwiązań audio i rozwijanie możliwości współpracy między ludźmi a AI.

Mati Staniszewski, CEO i współzałożyciel ElevenLabs, komentuje:

"ElevenLabszaczęło się od marzenia o uczynieniu wszystkich treści uniwersalnie dostępnymi w każdym języku i głosie. Dzięki wydaniu Eleven Multilingual v2realizujemy to marzenie, zbliżając się do wykorzystania głosów AI o jakości ludzkiej we wszystkich dialektach.AI.

"Narzędzia do generowania tekstu na mowę wyrównują szanse, oferując najwyższej jakości funkcje audio wszystkim twórcom. Te korzyści są teraz rozszerzone na prawie30języków w aplikacjach wielojęzycznych. Ostatecznie, z pomocąAI, chcemy pokryć jeszcze więcej języków i głosów, eliminując bariery językowe w treściach. W ElevenLabswierzymy, że te skoki w dostępności ostatecznie promują kreatywność, innowacyjność i różnorodność."

ElevenLabs umożliwia firmom i twórcom tworzenie bardziej kreatywnych i dostępnych treści, które rezonują w różnych kulturach i językach, redukując koszty i zasoby potrzebne do tworzenia wysokiej jakości treści audio w wielu językach.

Dla niezależnych deweloperów gier i wydawców, narzędzia do wielojęzycznego generowania głosu oferują nowe możliwości łączenia się z graczami i słuchaczami w ich języku, tłumacząc doświadczenia z gier i treści audio dla międzynarodowej publiczności, bez utraty jakości czy precyzji głosu.

Podobnie, instytucje edukacyjnemogą teraz natychmiast dostarczać uczniom dokładne treści audio w docelowym języku, wzmacniając umiejętności rozumienia i wymowy, oraz dostosowując się do różnych stylów nauczania i potrzeb uczniów z zagranicy.

Wszyscy twórcy mogą korzystać z narzędzi ElevenLabs, aby uzupełniać treści wizualne o głosy w wielu językach, poprawiającdostępnośćdla osób z niepełnosprawnościami wzrokowymi lub potrzebami edukacyjnymi.

Pierwszy zestaw narzędzi AI audio, opublikowany w styczniu 2023 roku, zawierał różne zdefiniowane wcześniej głosy syntetyczne i możliwość klonowania własnego głosu. Narzędzia do wielojęzycznego generowania głosu to kolejny krok w misji ElevenLabs, aby wszystkie treści były uniwersalnie dostępne w każdym języku i głosie.

Ta technologia jest już stosowana w różnych kreatywnych sektorach, takich jak tworzenie audiobooków przez niezależnych autorów, głosy postaci drugoplanowych w grach wideo, wsparcie dla osób niewidomych w dostępie do treści pisanych online, czy napędzanie pierwszego na świecie kanału radiowego AI. ElevenLabs współpracuje również z AI video generatorD-ID, jednym z największych wydawców audiobooków na świecieStorytel,otwartą platformą wideo naukowegoScienceCast, która kondensuje artykuły naukowe publikowane naarXiv,wiodącą platformą dla twórców treściTheSoul Publishing, Embark StudiosorazParadox Interactive, a także z różnymi czołowymi twórcami treści, studiami i platformami medialnymiMNTN.

Przeglądaj artykuły zespołu ElevenLabs

ElevenLabs

Twórz z najwyższą jakością dźwięku AI