Pomiń

Głosy ElevenLabs: Kompletny przewodnik

Wprowadzenie

W ElevenLabs przesuwamy granice innowacji w generatywnym głosie AI. Ten przewodnik daje przegląd naszych praktyk, procesów i technologii stojącej za głosami na naszej platformie.

Kategoryzacja głosów na ElevenLabs

1. Głosy ElevenLabs

Użytkownicy naszej platformy mogą wybierać spośród wielu dostępnych, gotowych głosów. To te głosy, które widzisz domyślnie w menu rozwijanym Syntezy Mowy. Dzielą się na dwie kategorie:


Prawnie Zakontraktowane Głosy
To głosy uzyskane poprzez legalne, płatne partnerstwa z profesjonalnymi aktorami głosowymi. Stanowią większość głosów, które znajdziesz w Syntezie Mowy. Priorytetujemy je nie tylko ze względu na ich niezrównaną jakość, ale także jako dowód naszego zaangażowania w wspieranie artystów w branży.

  • Współpraca z profesjonalnymi aktorami głosowymi przy konkretnych projektach.
  • Aktorzy głosowi wynagradzani na umowach terminowych.
  • Umowy licencyjne zapewniające aktorom głosowym prawa do ich głosów.

Losowo Generowane Głosy
To głosy tworzone za pomocą skomplikowanych algorytmów, które losowo próbkują cechy głosu. Te głosy są generowane za pomocą naszego narzędzia Voice Design.

  • Unikalne i nowe - każdy wygenerowany głos jest inny.
  • Nie naśladują ani nie replikują głosu konkretnej osoby.
  • Nie należą do żadnej konkretnej osoby.

2. Głosy Użytkowników

VoiceLab to nasz zestaw narzędzi dostępnych dla użytkowników do tworzenia i personalizacji głosów. Składa się z dwóch modeli klonowania głosu (Instant Voice Cloning (IVC) i Professional Voice Cloning (PVC)) oraz Voice Design - narzędzia do generowania nowych głosów poprzez losowe próbkowanie właściwości wokalnych.


Instant Voice Cloning (IVC)
Instant Voice Cloning pozwala użytkownikom szybko stworzyć cyfrową podobiznę głosu na podstawie krótkich próbek. IVC jest zaprojektowane, aby oferować szybkie rezultaty, z niższą jakością podglądu, co ułatwia eksperymentowanie z różnymi stylami głosu.

Kluczowe cechy:

  • Szybkie klonowanie z krótkich próbek głosu.

Środki bezpieczeństwa:

  • W przeciwieństwie do treningu od podstaw, gdzie potrzebne są ogromne ilości danych, ta technika wykorzystuje tzw. zero-shot learning. Tutaj AI słucha krótkiego klipu audio i natychmiast rozumie, jak replikować głos, bez potrzeby dalszego treningu. Wyniki nie będą identycznie przypominać oryginalnych próbek.
  • Głosy dodane przez indywidualnego użytkownika do Instant Voice Cloning pozostają wyłącznie na koncie tego użytkownika i nie mogą być udostępniane. Żaden inny użytkownik nie ma dostępu do głosów stworzonych za pomocą IVC.

Obowiązki użytkownika:

  • Przed każdym przesłaniem próbki głosu, użytkownicy muszą potwierdzić, że uzyskali niezbędne prawa i pozwolenia na klonowanie konkretnego głosu. To obowiązkowy krok, aby rozpocząć proces klonowania.
  • Aby uzyskać więcej informacji na temat bezpiecznego korzystania z naszej technologii klonowania głosu, zobacz nasz Przewodnik po Klonowaniu Głosu.
  • Niewłaściwe użycie funkcji klonowania głosu, zwłaszcza do celów nieautoryzowanych lub komercyjnych bez odpowiedniej zgody, skutkuje surowymi konsekwencjami, w tym trwałymi banami.

Professional Voice Cloning (PVC)
Professional Voice Cloning to bardziej zaawansowana funkcja klonowania głosu, która pozwala użytkownikom stworzyć wysokiej jakości replikę własnego głosu. Wymaga to treningu dedykowanego modelu na dużym zestawie próbek głosu – co najmniej 30 minut czystych danych audio.

Kluczowe cechy:

  • Wysokiej jakości, ultra-realistyczna reprodukcja głosu.

Środki bezpieczeństwa:

  • Ze względu na wysoką jakość wyników uzyskiwanych za pomocą PVC, wdrożyliśmy solidne środki bezpieczeństwa, aby zapewnić, że użytkownicy mogą klonować tylko własny głos.
  • Po przesłaniu danych mowy do treningu, użytkownik musi przejść etap weryfikacji: podawany jest tekst captcha, który użytkownik musi przeczytać na głos w ciągu 10 sekund.
  • Weryfikujemy żądanie, porównując profil głosu z tego nagrania z głosem zawartym w danych przesłanych przez użytkownika do klonowania.
  • Jeśli jest zgodność, żądanie jest wysyłane do dopracowania. Jeśli nie, użytkownik ma 4 próby weryfikacji. Po wyczerpaniu wszystkich prób bez sukcesu, użytkownik musi skontaktować się z naszym centrum pomocy w celu ręcznej weryfikacji głosu.
  • Domyślnie, głosy dodane przez indywidualnego użytkownika pozostają wyłącznie na koncie tego użytkownika.
  • Użytkownicy mogą zdecydować się na udostępnienie swojego Professional Voice Clone poprzez Voice Library, aby inni mogli z niego korzystać i zdobywać nagrody.

Obowiązki użytkownika:

  • Podobnie jak w przypadku IVC, nasze Warunki Usługi podkreślają znaczenie poszanowania praw jednostki. Niewłaściwe użycie tej funkcji, naruszające nasze warunki, skutkuje szybkimi i stanowczymi działaniami, w tym trwałymi banami z naszej platformy.

Voice Design
Voice Design pozwala na generowanie nowych syntetycznych głosów na podstawie wybranych przez użytkownika parametrów, takich jak wiek, płeć i akcent. Głosy stworzone w ten sposób pozostają spójne w charakterystyce mowy w różnych językach.

Kluczowe cechy:

  • Unikalne i nowe - każdy wygenerowany głos jest inny.
  • Nie naśladują ani nie replikują głosu konkretnej osoby.
  • Nie należą do żadnej konkretnej osoby.

3. Udostępnione Głosy

Voice Library to nasze środowisko do udostępniania głosów. Użytkownicy mogą udostępniać głosy wygenerowane za pomocą Voice Design lub własny głos stworzony za pomocą Professional Voice Cloning.

Udostępnianie Głosów Społeczności & Nagrody
Kompatybilność:

  • Voice Design
  • Professional Voice Cloning

Funkcje:

  • Nagrody za Użycie: Użytkownicy zdobywają nagrody, gdy inni korzystają z ich udostępnionego głosu.
  • Odkrywanie Głosów: Odkrywaj i używaj głosów z biblioteki do różnych potrzeb związanych z treścią.
  • Wszystkie głosy w Voice Library mają darmową licencję na użytek komercyjny.

Uwaga na temat Udostępniania Treści
Chociaż ElevenLabs oferuje zaawansowane narzędzia do generowania i klonowania głosów, ważne jest, aby zauważyć, że nasza platforma nie oferuje mechanizmu do publikowania ani udostępniania jakichkolwiek plików audio. Voice Library umożliwia użytkownikom udostępnianie niektórych głosów, które mogą być używane do tworzenia nowych treści audio, ale nie pozwala na udostępnianie żadnych rzeczywistych treści audio.

Wszelka dystrybucja lub udostępnianie treści stworzonych za pomocą naszych narzędzi poza naszą platformą spoczywa całkowicie na decyzji i odpowiedzialności użytkownika.

Zachęcamy do odpowiedzialnego i szanującego korzystania z naszej technologii i podejmiemy zdecydowane działania, jeśli zostaniemy powiadomieni o jakichkolwiek naruszeniach naszych Warunków Usługi. Ufamy naszej społeczności, że będzie świadoma potencjalnych implikacji klonowania głosu i będzie działać zgodnie z prawem oraz wytycznymi naszej platformy.

Nasze Zaangażowanie w Przejrzystość

Wprowadziliśmy narzędzia i zasoby, aby ułatwić odpowiedzialne korzystanie z naszej technologii.

  • AI Speech Classifier: Pozwala każdemu zweryfikować, czy próbka audio pochodzi z ElevenLabs.
  • Voice Captcha protection: Ensures the Professional Voice Cloning service remains secure.
  • Edukacja: Współpracujące przewodniki na temat bezpiecznego i legalnego korzystania z technologii klonowania głosu opracowane z ekspertami prawnymi.
  • Warunki Usługi: Wytyczne podkreślające legalne korzystanie z naszej technologii.
  • Jeśli natkniesz się na treści, które podejrzewasz, że zostały wygenerowane na naszej platformie i budzą obawy, zgłoś to tutaj.

Końcowa Uwaga

Jako pionierzy w technologiach głosowych opartych na AI, stawiamy na przejrzystość, integralność i szacunek. Cenimy nasze współprace ze społecznością aktorów głosowych i zawsze dążymy do tworzenia wartości dla naszych użytkowników, szanując prawa jednostki. W miarę jak idziemy naprzód, pozostajemy zaangażowani w odpowiedzialne wspieranie ludzkiej kreatywności.

ElevenLabs

Twórz z najwyższą jakością dźwięku AI