
Eleven v3 Audio Tags: Emulating accents with precision
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Przedstawiamy Eleven v3 Alpha
Wypróbuj v3Profesjonalne Voice Cloning to wygoda i spójność w różnych zastosowaniach audio
Z dumą udostępniamy nasz model Professional Voice Cloning (PVC) szerszej publiczności. Dotychczas dostępny tylko dla klientów korporacyjnych, teraz otwieramy dostęp dla wszystkich, umożliwiając stworzenie idealnej cyfrowej kopii własnego głosu; takiej, która jest praktycznie nie do odróżnienia od oryginału.
W marcu umożliwiliśmy użytkownikom przesyłanie danych głosowych i obiecaliśmy udostępnić głosy w lipcu na zasadzie „kto pierwszy, ten lepszy” - wreszcie są dostępne.
PVC jest darmowy dla wszystkich na planie Creator lub wyższym. Co więcej, twój głos PVC może automatycznie mówić we wszystkich językach obsługiwanych przez Eleven Multilingual v1!
Aby uzyskać dostęp do PVC, wystarczy przejść do VoiceLab, kliknąć „dodaj nowy głos” i wybrać Professional Voice Cloning. W przeciwieństwie do naszej funkcji Instant cloning, PVC wymaga trenowania dedykowanego modelu na dużym zbiorze próbek głosu - minimum 30 minut, optymalnie 3 godziny.
Aby zapewnić najwyższą jakość, pamiętaj o kilku rzeczach przygotowując próbki do dostrojenia.
Po pierwsze, upewnij się, że dane treningowe zawierają czyste pliki audio jednego mówcy, bez szumów tła, muzyki czy innych efektów. Jakiekolwiek dźwięki inne niż mowa mogą zmylić model i pojawić się w wyniku. Jeśli przesyłasz wiele plików audio nagranych w różnych sesjach, upewnij się, że warunki nagrywania są jak najbardziej zbliżone - zauważalne różnice w pogłosie czy odległości od mikrofonu również wpłyną na wynik.
To samo dotyczy twojego stylu mówienia - styl wypowiedzi powinien być jednolity we wszystkich przesyłanych próbkach. Na przykład, jeśli planujesz używać swojego głosu do nagrywania audiobooka, dane treningowe powinny zawierać nagrania w stylu audiobooka.
PVC jest zintegrowany ze wszystkimi naszymi modelami, w tym Eleven Multilingual v1. Jeśli mówisz w którymkolwiek z obsługiwanych języków, możesz stworzyć idealną replikę swojego głosu i sprawić, by mówił we wszystkich innych językach!
Uruchamiamy model co najmniej raz w miesiącu, w zależności od liczby zgłoszeń, z dalszymi przyspieszeniami oczekiwanymi pod koniec kwartału.
Aby zapewnić bezpieczne korzystanie z naszej technologii i utrzymać ścisłe wytyczne dotyczące prywatności i etyki użytkowników, zintegrowaliśmy solidne środki bezpieczeństwa, aby upewnić się, że możesz klonować tylko swój własny głos.
Po przesłaniu danych mowy do treningu następuje krok weryfikacji. Otrzymasz wtedy tekst captcha do przeczytania na głos w ciągu 10 sekund. Weryfikujemy twoje zgłoszenie, porównując profil głosu z tego nagrania z głosem zawartym w przesłanych danych.
Jeśli jest zgodność, twoje zgłoszenie jest wysyłane do dostrojenia. Jeśli nie, masz 4 próby weryfikacji. Jeśli wszystkie będą nieprawidłowe, musisz skontaktować się z naszym centrum pomocy, aby zweryfikować głos ręcznie.
Jeśli nie zdecydujesz się go udostępnić, twój głos należy tylko do ciebie i jest dostępny tylko dla ciebie.
Professional Voice Cloning to nie tylko wygoda, ale także wiele korzyści dla twoich projektów osobistych i komercyjnych. Oto kilka przykładów:
Professional Voice Cloning daje większą kontrolę nad tym, jak prezentujesz się cyfrowo. To więcej niż replikacja głosu - to szansa na wygodę i spójność w różnych zastosowaniach audio!
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Fine-grained control over timing, rhythm, and emphasis with Eleven v3 Audio Tags. Transform flat delivery into dynamic, performative content.