ElevenLabs wprowadza na rynek nowe produkty Voice AI i pozyskuje 80 mln USD w ramach serii B

Wzmocnienie pozycji w badaniach nad sztuczną inteligencją głosową i rozwoju produktów

  • ElevenLabs podniósł 80 mln dolarów w rundzie serii B współprowadzony przez Andreessen Horowitz, Nat Friedman, Daniel Gross, i dołączył do Kapitał Sekwoi, Zniszcz kapitał, Anioł SV, Kapitał szerokopasmowy I Przedsięwzięcia Credo aby wzmocnić swoją pozycję lidera w dziedzinie sztucznej inteligencji głosowej.
  • Firma ujawniła dziś również szereg nowych produktów, w tym Studio dubbingowe, Biblioteka głosowa rynek, wczesny podgląd Aplikacja mobilna do czytania, I nowe modele z zwiększona prędkość i obsługa większej liczby języków.
  • Od momentu wprowadzenia na rynek technologia ElevenLabs poprawiła dostępność treści na całym świecie w takich sektorach, jak gospodarka twórców, publikowanie, konwersacyjna sztuczna inteligencja, rozrywka, edukacja i dostępność, a jej przyjęcie przez miliony użytkowników doprowadziło firmę do status jednorożca.

22 stycznia / Globalnie - ElevenLabs, firma zajmująca się badaniami technologii głosowych, pozyskała 80 mln dolarów w ramach rundy finansowania serii B, której współprzewodniczy Andreessen Horowitz, Nat Friedman, Daniel Grossi dołączył do Kapitał Sekwoi, Anioł SV, Zniszcz kapitał, Kapitał szerokopasmowy I Przedsięwzięcia Credo, aby ugruntować swoją pozycję światowego lidera w dziedzinie badań nad sztuczną inteligencją głosową i wdrażania produktów.

Od momentu publicznej premiery ElevenLabs jest branżowym liderem w dziedzinie naturalnej syntezy mowy, umożliwiając użytkownikom tworzenie i projektowanie głosów AI w szerokiej gamie języków i akcentów, z możliwością przekazywania szerokiej gamy emocji i intonacji. Od momentu uruchomienia użytkownicy ElevenLabs wygenerowali ponad 100 lat audio, podczas gdy firma rozrosła się z 5 do 40 pracowników. Obecnie z technologii ElevenLabs korzystają pracownicy 41% z listy Fortune 500 firmy. 

Technologia ElevenLabs została wdrożona w wielu branżach. Umożliwiło twórcom udoskonalenie wrażeń odbiorców dzięki lektorowi i dubbingowi opartemu na sztucznej inteligencji, poszerzyło dostęp do edukacji i dostarczyło innowacyjnych rozwiązań w zakresie publikacji audiobooków, rozrywki i użytku osobistego, w tym poprawiło dostępność. Środki te zostaną wykorzystane do dalszego udoskonalenia oferty produktowej firmy, przy jednoczesnym zapewnieniu bezpiecznego wdrożenia technologii sztucznej inteligencji.

Oprócz dzisiejszego ogłoszenia dotyczącego serii B, ElevenLabs ujawnia również kilka nowych rozwiązań produktowych, które zostaną wprowadzone na rynek w ciągu najbliższych tygodni:

  • Nowy Studio dubbingowe przepływ pracy umożliwia użytkownikom dubbingowanie całych filmów, a także generowanie i edycję ich transkrypcji, tłumaczeń i kodów czasowych, zapewniając dodatkową kontrolę nad produkcją treści. Możliwości te uzupełniają już istniejącą funkcję dubbingu opartego na sztucznej inteligencji, która umożliwia automatyczną, kompleksową lokalizację wideo w 29 językach.
  • A Biblioteka głosowa rynek, który zapewni bezpieczną platformę, na której użytkownicy będą mogli zarabiać na wersjach swojego głosu opartych na sztucznej inteligencji. Użytkownicy mogą tworzyć profesjonalne repliki głosu oparte na sztucznej inteligencji, weryfikować je i udostępniać za pośrednictwem Biblioteki Głosów. Gdy inni używają tych zweryfikowanych głosów, oryginalni twórcy otrzymują wynagrodzenie. Użytkownicy zawsze zachowują kontrolę nad dostępnością swojego głosu i warunkami rekompensaty. Rynek już teraz generuje dochód dla niewielkiej grupy użytkowników alfa.
  • Wczesny podgląd Aplikacja mobilna czytelnik To umożliwia natychmiastową konwersję tekstu i adresów URL na dźwięk, ułatwiając użytkownikom dostęp do treści w innym medium podczas podróży. W ramach okresu próbnego aplikacja będzie dostępna bezpłatnie przez pierwsze trzy miesiące, a użytkownicy będą mogli zapisać się na listę oczekujących, aby uzyskać wcześniejszy dostęp.

Przez cały rok 2023 ElevenLabs zwiększało swoją obecność w wielu sektorach, w tym w branży wydawniczej, gier, mediów i komunikacji, a także nawiązywało partnerstwa B2B z największymi domami mediowymi, w tym:

  • Wydawniczy: Storytel, The Washington Post, Rheinische Post, Curio
  • Sztuczna inteligencja konwersacyjna: FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana
  • Media i rozrywka: Wondershare Filmora, Futuri Media, TheSoul Publishing
  • Hazard: Paradox Interactive, NetEase, Inworld AI

Najnowsze premiery produktów i partnerstwa następują po okresie, w którym ElevenLabs nieustannie poszerzało swój zestaw narzędzi, opracowanych w oparciu o wewnętrzne badania. Wydania obejmowały: Synteza mowy dla realistycznych tekst na mowę konwersja wraz z modelem Turbo zoptymalizowanym pod kątem opóźnień; Projektowanie Głosu I Klonowanie głosu do tworzenia indywidualnych głosów; Mowa do mowy do przekształcania jednego głosu w inny. Firma wypuściła również swój wiodący w branży Dubbingowanie AI narzędzie, które umożliwia automatyczne tłumaczenie dźwięku i obrazu na 29 języków przy jednoczesnym zachowaniu głosu i emocji oryginalnego mówcy. Firma wkrótce rozszerzy modele Turbo i Speech to Speech, które są obecnie dostępne w języku angielskim, na szerszy zestaw języków. 

Bazując na badaniach stanowiących podstawę tych funkcji, firma ElevenLabs pracowała również nad opracowaniem zaawansowanych narzędzi do bardziej złożonych przepływów pracy, takich jak Projektowanie do publikacji i Studio dubbingowe do lokalizacji wideo. Projektowanie usprawnia edycję, strukturyzację, nawigację i generowanie treści o długiej formie dla wydawców oraz Studio dubbingowe pomaga w przygotowywaniu treści dla odbiorców na całym świecie, zapewniając bezpośrednią kontrolę nad transkrypcją, tłumaczeniem i harmonogramem sekwencji.

Firma opracowała również produkty zorientowane na społeczność, takie jak: Biblioteka głosowa - środowisko umożliwiające udostępnianie głosów generowanych przez sztuczną inteligencję. Wcześniej usługa Voice Library ograniczała się do udostępniania sztucznych głosów utworzonych za pomocą narzędzia Voice Design. Teraz użytkownicy mogą udostępniać własne zweryfikowane repliki głosów utworzone za pomocą narzędzia Professional Voice Cloning w ramach nowo wprowadzonej funkcji Biblioteka głosowa na rynku i zarabiaj pieniądze, gdy inni z nich korzystają. Aby zagwarantować bezpieczeństwo i integralność rynku, ElevenLabs korzysta z technologii Professional Voice Cloning w celu tworzenia replik głosu o wysokiej wierności. Przed udostępnieniem głosu użytkownicy muszą przejść weryfikację Voice Captcha, czytając w określonym czasie monit tekstowy, aby potwierdzić, czy ich głos jest zgodny z próbkami treningowymi. Proces ten, wraz z moderacją i ręcznym zatwierdzaniem przez zespół ElevenLabs, gwarantuje, że autentyczne, zweryfikowane przez użytkowników głosy są udostępniane i monetyzowane, tworząc bezpieczniejsze i bardziej wiarygodne środowisko.

Podstawowym priorytetem ElevenLabs jest bezpieczny i odpowiedzialny rozwój sztucznej inteligencji, ze szczególnym uwzględnieniem umożliwienia wykrywania, aby zapewnić łatwą identyfikację wszystkich treści generowanych przez sztuczną inteligencję. Firma uruchomiła Klasyfikator mowy AI w zeszłym roku; narzędzie, które potrafi sprawdzić, czy próbka audio zawiera treść wygenerowaną przez ElevenLabs. W tym roku firma będzie pracować nad rozszerzeniem możliwości Klasyfikatora, aby objąć nim większą liczbę modeli sztucznej inteligencji głosowej, a także nawiąże współpracę z innymi platformami dystrybucyjnymi w celu szerszego wdrożenia. ElevenLabs aktywnie opracowuje dodatkowe zabezpieczenia mające na celu zwiększenie bezpieczeństwa w przestrzeni publicznej.

Dzięki tej inwestycji serii B firma ElevenLabs zamierza ugruntować swoją pozycję światowego lidera w dziedzinie badań nad sztuczną inteligencją głosową i wdrażania produktów. Kapitał zostanie przeznaczony na rozwój badań, rozbudowę infrastruktury, opracowywanie nowych produktów dla określonych sektorów i wzmocnienie środków bezpieczeństwa w celu zapewnienia odpowiedzialnego i etycznego rozwoju technologii sztucznej inteligencji.

Piotr Dąbkowski, CTO ElevenLabs, dodaje:

„Zaangażowanie naszego zespołu już wywarło trwały wpływ na sztuczną inteligencję głosową. Dzięki temu nowemu finansowaniu możemy podjąć się jeszcze większych wyzwań i skupić się na utrzymaniu naszej przewagi konkurencyjnej w zakresie badań i rozwoju produktów”.

Mati Staniszewski podsumowuje:

„Nasza ambicja pozostaje ta sama – przekształcić sposób, w jaki wchodzimy w interakcję z treścią, przełamując bariery językowe i komunikacyjne. Opracowujemy najnowocześniejszą technologię, która umożliwia dostęp do treści w różnych językach i głosach, aby każdy mógł mieć dostęp do informacji i historii, które są dla niego ważne. „Nasze dotychczasowe postępy są owocem zaangażowania naszego zespołu i inwestorów. Choć to dopiero początek naszej podróży, wspólnie pomagamy kształtować przyszłość dostępności i komunikacji”.

Odkryj więcej

ElevenLabs

Twórz przy użyciu technologii audio AI zapewniającej najwyższą jakość