ElevenLabs pozyskuje 2 mln USD i ogłasza platformę AI Speech, która ma zrewolucjonizować opowiadanie audio
- Opublikowano
PosłuchajPosłuchaj tego artykułu
- ElevenLabs uruchamia platformę Beta, umożliwiając twórcom i wydawcom narrację długich treści
- Runda finansowania pre-seed była prowadzona przez Credo Ventures, z udziałem Concept Ventures i indywidualnych inwestorów
- Kapitał pozwoli nam rozwijać badania i rozwój AI
2023-01-23, Londyn, UK | ElevenLabs, startup technologii głosu AI, buduje narzędzia do syntezy mowy, dążąc do natychmiastowego przekształcania mowy między językami. Dziś ogłosili uruchomienie platformy Beta po zebraniu 2 milionów dolarów w rundzie finansowania pre-seed prowadzonej przez Credo Ventures, z udziałem Concept Ventures i innych inwestorów indywidualnych.
Nasza platforma pozwala twórcom i wydawcom nagrywać dłuższe treści i przechodzić na format audio. Wszystko działa dzięki naszemu autorskiemu modelowi deep learning do syntezy mowy, który naturalnie oddaje ludzką intonację i akcenty oraz dopasowuje sposób mówienia do kontekstu. Oferujemy też narzędzia do
Postępy w możliwościach wymagają innowacji, dlatego ElevenLabs uważa się przede wszystkim za firmę badawczą. Większość dotychczasowych badań skupiała się na opracowywaniu nowych modeli zamiany tekstu na mowę które opierają się na wysokiej kompresji i zrozumieniu kontekstu, aby ultra-realistycznie oddać ludzką mowę. Firma stworzyła również nowy model klonowania głosu, który osiąga wysokie podobieństwo wyjściowe bez treningu (bez dostrajania), na próbkach o długości zaledwie 5 sekund - co wcześniej było niespotykane. Deweloperzy mogą uzyskać dostęp do wszystkich tych funkcji przez API.
Te badania napędzają obecne funkcje platformy, ale pomagają też spełnić nasz główny cel – natychmiastową zamianę mowy między językami. Nasze narzędzie do AI dubbingu, które planujemy udostępnić jeszcze w tym roku, pozwoli automatycznie podłożyć głos w innym języku do dowolnego nagrania audio lub wideo, zachowując oryginalny głos mówiącego. Na początku chcemy zainteresować tym rozwiązaniem branżę edukacyjną, a docelowo umożliwić wielojęzyczne audio na żądanie w streamingu,
Narzędzia do syntezy mowy i dubbingu firmy są tak samo komplementarne, jak i dobrze wyważone w czasie: oba obiecują dotrzeć z audio i wideo do szerszej publiczności i oba pojawiają się w momencie, gdy przestrzeń audio przeżywa rozkwit. Wczesna grupa testerów, w tym twórcy YouTube, wydawcy i deweloperzy, już codziennie korzysta z platformy do nagrywania wideo, opowieści i postaci, a firma spodziewa się, że sfera potencjalnych zastosowań dla generatywnej mowy będzie się tylko rozszerzać. Wydawcy wiadomości już odkryli, że rozwijanie obecności audio to świetny sposób na angażowanie i utrzymywanie subskrybentów. Jednak zatrudnianie aktorów głosowych jest kosztowne, podobnie jak czytanie przez reporterów ich opowieści. Autorzy książek i newsletterów, a nawet twórcy gier, stają przed podobnymi wyzwaniami: ci pierwsi coraz częściej decydują się na narrację własnych dzieł, a ci drudzy muszą zdecydować, czy dana postać uzasadnia koszty nagrania. Ci, którzy korzystają z istniejącego oprogramowania do zamiany tekstu na mowę, oszczędzają pieniądze, ale płacą inną cenę, rezygnując z jakości. ElevenLabs podkreśla, że nie ma już potrzeby kompromisów, gdy przygotowują się do wyposażenia twórców i wydawców w najbardziej zaawansowane i wszechstronne narzędzia do opowiadania historii AI.
„Platforma, którą teraz uruchamiamy, polega na przekształcaniu tekstu w najwyższej jakości mowę. Chcemy, aby ludzie mogli cieszyć się ulubioną książką lub newsletterem, dając głos wszystkim autorom, twórcom i deweloperom, którzy nie mogli sobie na to pozwolić” - mówi Mati Staniszewski, współzałożyciel. „Naszym ostatecznym celem jest umożliwienie ludziom cieszenia się dowolnymi treściami, które uznają za istotne i interesujące, niezależnie od języka, którym się posługują” - dodaje Piotr Dąbkowski, również współzałożyciel.
W Credo Ventures dążymy do współpracy z inteligentnymi i ambitnymi założycielami z regionu CEE. Zobaczyliśmy głód i iskrę w oczach Matiego i Piotra na naszym pierwszym spotkaniu. Kilka miesięcy później stają się centrum badawczym technologii mowy na poziomie OpenAI, pokonując największe wyzwania w sztucznym audio. Ich zsyntetyzowane głosy są już nie do odróżnienia od prawdziwych, a ten przełom nie tylko znacznie obniżył bariery w generowaniu treści o niespotykanej jakości i wierności, ale wkrótce pozwoli twórcom radykalnie rozszerzyć swoją publiczność, stając się wielojęzycznymi. – mówi Maciek Gnutek, General Partner w Credo Ventures.
Pomimo że audio jest powszechne zarówno w rozrywce, jak i biznesie, zostało stosunkowo zaniedbane przez ostatnie postępy w badaniach. Nie możemy być bardziej podekscytowani wspieraniem Matiego i Piotra w tej złotej erze dla generatywnej AI i wierzymy, że ElevenLabs to zespół, który wprowadzi tę technologię do mas, głos po głosie - mówi Oliver Kicks, Principal w Concept Ventures.
O ElevenLabs:
ElevenLabs to firma badawcza, która tworzy oprogramowanie do syntezy głosu AI dla twórców i wydawców. Nasze narzędzia generują naturalnie brzmiącą mowę i potrafią zmieniać intonację oraz akcenty w zależności od kontekstu lub wskazówek użytkownika. Nasza platforma daje jakość i elastyczność potrzebną, by wygodnie nagrywać newsy, newslettery, książki i filmy. Najważniejsze funkcje to: generowanie mowy z tekstu, voice cloning,
Kapitał venture dostarczony przez Credo Ventures i Concept Ventures. Inwestorzy indywidualni to Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst i Harry Songhurst.
Kontakt
press@elevenlabs.io




