
ElevenLabs wprowadza nowe produkty generatywne Voice AI i ogłasza rundę Series A o wartości 19 mln dolarów prowadzoną przez Nat Friedman, Daniel Gross i Andreessen Horowitz
- Kategoria
- Firma
- Data
Wzmocnienie pozycji w badaniach nad sztuczną inteligencją głosową i rozwoju produktów
22 stycznia / Globalnie - ElevenLabs, firma zajmująca się badaniami technologii głosowych, pozyskała 80 mln dolarów w ramach rundy finansowania serii B, której współprzewodniczy Andreessen Horowitz, Nat Friedman, Daniel Grossi dołączył do Kapitał Sekwoi, Anioł SV, Zniszcz kapitał, Kapitał szerokopasmowy I Przedsięwzięcia Credo, aby ugruntować swoją pozycję światowego lidera w dziedzinie badań nad sztuczną inteligencją głosową i wdrażania produktów.
Od momentu publicznego debiutu, ElevenLabs prowadzi w branży naturalnej syntezy mowy, umożliwiając użytkownikom tworzenie i projektowanie 100 lat w wielu językach i akcentach, z możliwością wyrażania szerokiej gamy emocji i intonacji. Od debiutu, użytkownicy ElevenLabs wygenerowali ponad 100 lat audio, a firma rozrosła się z 5 do 40 pracowników. Dziś technologia ElevenLabs jest używana przez pracowników w
Technologia ElevenLabs została wdrożona w wielu branżach. Umożliwiło twórcom udoskonalenie wrażeń odbiorców dzięki lektorowi i dubbingowi opartemu na sztucznej inteligencji, poszerzyło dostęp do edukacji i dostarczyło innowacyjnych rozwiązań w zakresie publikacji audiobooków, rozrywki i użytku osobistego, w tym poprawiło dostępność. Środki te zostaną wykorzystane do dalszego udoskonalenia oferty produktowej firmy, przy jednoczesnym zapewnieniu bezpiecznego wdrożenia technologii sztucznej inteligencji.
Oprócz dzisiejszego ogłoszenia dotyczącego serii B, ElevenLabs ujawnia również kilka nowych rozwiązań produktowych, które zostaną wprowadzone na rynek w ciągu najbliższych tygodni:
Przez cały rok 2023 ElevenLabs zwiększało swoją obecność w wielu sektorach, w tym w branży wydawniczej, gier, mediów i komunikacji, a także nawiązywało partnerstwa B2B z największymi domami mediowymi, w tym:
Najnowsze premiery produktów i partnerstwa następują po okresie, w którym ElevenLabs nieustannie poszerzało swój zestaw narzędzi, opracowanych w oparciu o wewnętrzne badania. Wydania obejmowały: Synteza mowy dla realistycznych tekst na mowę konwersja wraz z modelem Turbo zoptymalizowanym pod kątem opóźnień; Projektowanie Głosu I Klonowanie głosu do tworzenia indywidualnych głosów; Mowa do mowy do przekształcania jednego głosu w inny. Firma wypuściła również swój wiodący w branży Dubbingowanie AI narzędzie, które umożliwia automatyczne tłumaczenie dźwięku i obrazu na 29 języków przy jednoczesnym zachowaniu głosu i emocji oryginalnego mówcy. Firma wkrótce rozszerzy modele Turbo i Speech to Speech, które są obecnie dostępne w języku angielskim, na szerszy zestaw języków.
Bazując na badaniach stanowiących podstawę tych funkcji, firma ElevenLabs pracowała również nad opracowaniem zaawansowanych narzędzi do bardziej złożonych przepływów pracy, takich jak Projektowanie do publikacji i Studio dubbingowe do lokalizacji wideo. Projektowanie usprawnia edycję, strukturyzację, nawigację i generowanie treści o długiej formie dla wydawców oraz Studio dubbingowe pomaga w przygotowywaniu treści dla odbiorców na całym świecie, zapewniając bezpośrednią kontrolę nad transkrypcją, tłumaczeniem i harmonogramem sekwencji.
Firma opracowała również produkty zorientowane na społeczność, takie jak: Biblioteka głosowa - środowisko umożliwiające udostępnianie głosów generowanych przez sztuczną inteligencję. Wcześniej usługa Voice Library ograniczała się do udostępniania sztucznych głosów utworzonych za pomocą narzędzia Voice Design. Teraz użytkownicy mogą udostępniać własne zweryfikowane repliki głosów utworzone za pomocą narzędzia Professional Voice Cloning w ramach nowo wprowadzonej funkcji Biblioteka głosowa na rynku i zarabiaj pieniądze, gdy inni z nich korzystają. Aby zagwarantować bezpieczeństwo i integralność rynku, ElevenLabs korzysta z technologii Professional Voice Cloning w celu tworzenia replik głosu o wysokiej wierności. Przed udostępnieniem głosu użytkownicy muszą przejść weryfikację Voice Captcha, czytając w określonym czasie monit tekstowy, aby potwierdzić, czy ich głos jest zgodny z próbkami treningowymi. Proces ten, wraz z moderacją i ręcznym zatwierdzaniem przez zespół ElevenLabs, gwarantuje, że autentyczne, zweryfikowane przez użytkowników głosy są udostępniane i monetyzowane, tworząc bezpieczniejsze i bardziej wiarygodne środowisko.
Podstawowym priorytetem ElevenLabs jest bezpieczny i odpowiedzialny rozwój sztucznej inteligencji, ze szczególnym uwzględnieniem umożliwienia wykrywania, aby zapewnić łatwą identyfikację wszystkich treści generowanych przez sztuczną inteligencję. Firma uruchomiła Klasyfikator mowy AI w zeszłym roku; narzędzie, które potrafi sprawdzić, czy próbka audio zawiera treść wygenerowaną przez ElevenLabs. W tym roku firma będzie pracować nad rozszerzeniem możliwości Klasyfikatora, aby objąć nim większą liczbę modeli sztucznej inteligencji głosowej, a także nawiąże współpracę z innymi platformami dystrybucyjnymi w celu szerszego wdrożenia. ElevenLabs aktywnie opracowuje dodatkowe zabezpieczenia mające na celu zwiększenie bezpieczeństwa w przestrzeni publicznej.
Dzięki tej inwestycji serii B firma ElevenLabs zamierza ugruntować swoją pozycję światowego lidera w dziedzinie badań nad sztuczną inteligencją głosową i wdrażania produktów. Kapitał zostanie przeznaczony na rozwój badań, rozbudowę infrastruktury, opracowywanie nowych produktów dla określonych sektorów i wzmocnienie środków bezpieczeństwa w celu zapewnienia odpowiedzialnego i etycznego rozwoju technologii sztucznej inteligencji.
Piotr Dąbkowski, CTO ElevenLabs, dodaje:
„Zaangażowanie naszego zespołu już wywarło trwały wpływ na sztuczną inteligencję głosową. Dzięki temu nowemu finansowaniu możemy podjąć się jeszcze większych wyzwań i skupić się na utrzymaniu naszej przewagi konkurencyjnej w zakresie badań i rozwoju produktów”.
Mati Staniszewski podsumowuje:
„Nasza ambicja pozostaje ta sama – przekształcić sposób, w jaki wchodzimy w interakcję z treścią, przełamując bariery językowe i komunikacyjne. Opracowujemy najnowocześniejszą technologię, która umożliwia dostęp do treści w różnych językach i głosach, aby każdy mógł mieć dostęp do informacji i historii, które są dla niego ważne. „Nasze dotychczasowe postępy są owocem zaangażowania naszego zespołu i inwestorów. Choć to dopiero początek naszej podróży, wspólnie pomagamy kształtować przyszłość dostępności i komunikacji”.

.webp&w=3840&q=80)

