Przedstawiamy Eleven v3 Alpha

Wypróbuj v3

Stwórz idealną cyfrową kopię swojego głosu i mów językami, których nie znasz!

Profesjonalne Voice Cloning to wygoda i spójność w różnych zastosowaniach audio

Z dumą udostępniamy nasz model Professional Voice Cloning (PVC) szerszej publiczności. Dotychczas dostępny tylko dla klientów korporacyjnych, teraz otwieramy dostęp dla wszystkich, umożliwiając stworzenie idealnej cyfrowej kopii własnego głosu; takiej, która jest praktycznie nie do odróżnienia od oryginału.

W marcu umożliwiliśmy użytkownikom przesyłanie danych głosowych i obiecaliśmy udostępnić głosy w lipcu na zasadzie „kto pierwszy, ten lepszy” - wreszcie są dostępne.

PVC jest darmowy dla wszystkich na planie Creator lub wyższym. Co więcej, twój głos PVC może automatycznie mówić we wszystkich językach obsługiwanych przez Eleven Multilingual v1!

Proces

Aby uzyskać dostęp do PVC, wystarczy przejść do VoiceLab, kliknąć „dodaj nowy głos” i wybrać Professional Voice Cloning. W przeciwieństwie do naszej funkcji Instant cloning, PVC wymaga trenowania dedykowanego modelu na dużym zbiorze próbek głosu - minimum 30 minut, optymalnie 3 godziny.

Aby zapewnić najwyższą jakość, pamiętaj o kilku rzeczach przygotowując próbki do dostrojenia.

Po pierwsze, upewnij się, że dane treningowe zawierają czyste pliki audio jednego mówcy, bez szumów tła, muzyki czy innych efektów. Jakiekolwiek dźwięki inne niż mowa mogą zmylić model i pojawić się w wyniku. Jeśli przesyłasz wiele plików audio nagranych w różnych sesjach, upewnij się, że warunki nagrywania są jak najbardziej zbliżone - zauważalne różnice w pogłosie czy odległości od mikrofonu również wpłyną na wynik.

To samo dotyczy twojego stylu mówienia - styl wypowiedzi powinien być jednolity we wszystkich przesyłanych próbkach. Na przykład, jeśli planujesz używać swojego głosu do nagrywania audiobooka, dane treningowe powinny zawierać nagrania w stylu audiobooka.

PVC jest zintegrowany ze wszystkimi naszymi modelami, w tym Eleven Multilingual v1. Jeśli mówisz w którymkolwiek z obsługiwanych języków, możesz stworzyć idealną replikę swojego głosu i sprawić, by mówił we wszystkich innych językach!

Uruchamiamy model co najmniej raz w miesiącu, w zależności od liczby zgłoszeń, z dalszymi przyspieszeniami oczekiwanymi pod koniec kwartału.

Zabezpieczenia

Aby zapewnić bezpieczne korzystanie z naszej technologii i utrzymać ścisłe wytyczne dotyczące prywatności i etyki użytkowników, zintegrowaliśmy solidne środki bezpieczeństwa, aby upewnić się, że możesz klonować tylko swój własny głos.

Po przesłaniu danych mowy do treningu następuje krok weryfikacji. Otrzymasz wtedy tekst captcha do przeczytania na głos w ciągu 10 sekund. Weryfikujemy twoje zgłoszenie, porównując profil głosu z tego nagrania z głosem zawartym w przesłanych danych.

Jeśli jest zgodność, twoje zgłoszenie jest wysyłane do dostrojenia. Jeśli nie, masz 4 próby weryfikacji. Jeśli wszystkie będą nieprawidłowe, musisz skontaktować się z naszym centrum pomocy, aby zweryfikować głos ręcznie.

Jeśli nie zdecydujesz się go udostępnić, twój głos należy tylko do ciebie i jest dostępny tylko dla ciebie.

Zastosowania

Professional Voice Cloning to nie tylko wygoda, ale także wiele korzyści dla twoich projektów osobistych i komercyjnych. Oto kilka przykładów:

  • Tworzenie treści: Twórcy treści mogą przekazywać swoje wiadomości nawet wtedy, gdy nie mogą nagrywać osobiście, co oznacza brak przerw w harmonogramie treści.
  • Audiobooki: Sklonuj swój głos i użyj Studio do narracji całego audiobooka w swoim stylu, niezależnie od długości książki czy dostępnego czasu nagrywania.
  • Prezentacje cyfrowe: Użyj sklonowanego głosu, aby dostarczyć przekonującą, spójną narrację i stać się częścią swoich prezentacji, nawet gdy nie jesteś fizycznie obecny.
  • Systemy IVR: Firmy mogą dodać bardziej osobisty akcent do interakcji z klientami, używając głosów swoich pracowników w automatycznych odpowiedziach.
  • Podcasty: Podcasterzy mogą utrzymać harmonogram swojego programu, nawet gdy nie mogą nagrywać.

Twoje nowe cyfrowe ja

Professional Voice Cloning daje większą kontrolę nad tym, jak prezentujesz się cyfrowo. To więcej niż replikacja głosu - to szansa na wygodę i spójność w różnych zastosowaniach audio!



Zobacz więcej

ElevenLabs

Twórz z najwyższą jakością dźwięku AI