ElevenLabs wychodzi z bety i wprowadza Eleven Multilingual v2 – przełomowy model językowy AI dla 30 języków
- Opublikowano
PosłuchajPosłuchaj tego artykułu
- ElevenLabs, platforma do lingwistycznej AI, robi duży krok naprzód w naszym dążeniu do przełamywania barier językowych w treściach, wprowadzając nowy model deep learning, który obsługuje wiele języków –Eleven Multilingual v2
- To rozwiązanie pozwoli mediom, twórcom gier, wydawcom i niezależnym autorom na całym świecie znacznie zwiększyć dostępność swoich treści
- Te nowe możliwości, które pojawiły się po serii aktualizacji i ulepszeń od startu platformy w styczniu, oznaczają też oficjalny koniec fazy beta
- Naszą misją w ElevenLabs jest, by każda treść była dostępna w dowolnym języku i każdym głosem
Londyn, Wielka Brytania– ElevenLabs, światowy lider w oprogramowaniu do generowania mowy AI, ogłosił dziś nowy wielojęzyczny model generowania głosu,który potrafi tworzyć „pełne emocji” audio AI w 30 językach.
Model, oparty w całości na naszych własnych badaniach, pozwoli deweloperom tworzyć zlokalizowane treści audio na rynki w Europie, Azji i na Bliskim Wschodzie. Przez ostatnie 18 miesięcy analizowaliśmy cechy ludzkiej mowy, opracowaliśmy nowe sposoby rozumienia kontekstu i wyrażania emocji w generowaniu głosu oraz stworzyliśmy unikalne, nowe głosy.
Dzięki Eleven Multilingual v2nowy model potrafi automatycznie rozpoznawać prawie 30 języków pisanych na platformie Text to Speech od ElevenLabs i generować mowę w tych językach z niespotykaną dotąd autentycznością.
Niezależnie od tego, czy używasz głosu syntetycznego, czy klonowanego, unikalne cechy głosu mówiącego zostają zachowane we wszystkich językach, w tym oryginalny akcent. Oznacza to, że jedną głosem możesz ożywić treści w 30 różnych językach.
Towdrożenienastępuje po udostępnieniu Professional Voice Cloning wszystkim twórcom na platformie. Dzięki tej aktualizacji, która pojawiła się razem z dodatkowymi zabezpieczeniami, możesz stworzyć idealną cyfrową kopię swojego głosu, która
praktycznie nie różni się od oryginału. Od dziś twój głos może mówić w prawie 30 językach dostępnych w modelu wielojęzycznym.
Obsługiwane języki to:koreański, niderlandzki, turecki, szwedzki, indonezyjski, wietnamski, filipiński, ukraiński, grecki, czeski, fiński, rumuński, duński, bułgarski, malajski, węgierski, norweski, słowacki, chorwacki, arabski (standardowy) i tamilski. Te języki uzupełniają już dostępne: angielski, polski, niemiecki, hiszpański, francuski, włoski, hindi i portugalski.
Po wprowadzeniu nowych funkcji i ciągłych ulepszeniach ElevenLabs potwierdza dziś oficjalne wyjście platformy z bety. To ważny moment w naszym zaangażowaniu, by zapewniać ponad milionowi użytkowników na całym świecie niezawodne i nowoczesne narzędzia.
W przyszłości planujemy wprowadzić mechanizm, który pozwoli użytkownikom dzielić się swoimi głosami na platformie i korzystać z rozwoju nowych danych audio, by wspierać współpracę człowieka z AI.
Mati Staniszewski, CEO i założyciel ElevenLabs, mówi:
„Założyliśmy ElevenLabs z marzeniem, by każda treść była dostępna w dowolnym języku i każdym głosem. Dzięki Eleven Multilingual v2 jesteśmy o krok bliżej – udostępniamy głosy AI w jakości ludzkiej w każdym dialekcie.
Nasze narzędzia do syntezy mowy otwierają nowe możliwości dla wszystkich twórców, dając im wysoką jakość i wybór. Teraz te korzyści obejmują też wielojęzyczne zastosowania w prawie 30 językach. Wierzymy, że z pomocą AI obejmiemy jeszcze więcej języków i głosów, by zlikwidować bariery językowe w treściach. W ElevenLabs wierzymy, że taka dostępność przełoży się na więcej kreatywności, innowacji i różnorodności.”
ElevenLabs obniża koszty i ogranicza zasoby potrzebne do tworzenia wysokiej jakości treści audio w wielu językach. Firmy i twórcy mogą dzięki temu tworzyć ciekawsze i łatwiej dostępne treści, które trafiają do odbiorców niezależnie od języka czy kultury.
Niezależnym twórcom i wydawcom gierwielojęzyczne narzędzie do generowania głosu daje nowe możliwości tłumaczenia gier i treści audio dla międzynarodowej publiczności oraz komunikowania się z graczami i słuchaczami w ich języku – bez kompromisów w jakości czy dokładności głosu.
Podobnieinstytucje edukacyjnemogą teraz natychmiast udostępniać uczniom precyzyjne treści audio w docelowym języku, by poprawić rozumienie i wymowę oraz dopasować się do różnych stylów nauki i potrzeb studentów z całego świata.
Twórcy wszelkiego rodzaju mogą korzystać z narzędzi ElevenLabs, byzwiększyć dostępnośćswoich treści dla osób z wadami wzroku lub dodatkowymi potrzebami edukacyjnymi, wzbogacając materiały wizualne o głos w wielu językach.
Pierwszy zestaw narzędzi AI do generowania głosu, który pokazaliśmy w styczniu 2023, pozwala zamienić dowolny tekst na mowę, korzystając z gotowych głosów syntetycznych lub klonując własny głos. Wielojęzyczne narzędzie do syntezy mowy to kolejny krok w naszej misji, by każda treść była dostępna w dowolnym języku i każdym głosem.
Technologia ElevenLabs jest już używana w wielu branżach kreatywnych. Pozwala niezależnym autorom tworzyć audiobooki, podkładać głosy postaciom w grach, ułatwiać osobom niewidomym dostęp do tekstów online czy prowadzić pierwszy na świecie radiowy kanał AI. Współpracujemy też z czołowymi twórcami i studiami, m.in. z twórcą AI-videoD-ID, Storytel, jednym z największych wydawców audiobooków na świecie, otwartą platformą wideoScienceCast, której narzędzie do generowania wideo agreguje badania naukowe publikowane naarXiv,wiodącą platformą dla twórców treściTheSoul Publishing,świetnymi twórcami gier jakEmbark StudiosorazParadox Interactivei platformą medialnąMNTN.




