
Turbo v2 jest już dostępny!
- Kategoria
- Produkt
- Data
Zmień swój głos na inny, kontrolując emocje, tempo i sposób mówienia.
Voice Changer wcześniej nazywał się speech-to-speech. W kontekście agentów głosowych AI, „speech-to-speech” oznacza też połączone architektury, gdzie jeden model obsługuje bezpośrednio dźwięk jako wejście i wyjście. ElevenAgents korzysta z zaawansowanej kaskadowej architektury. Dowiedz się więcej: Modele kaskadowe vs połączone.
Dodaliśmy
Więcej emocji w głosie.

Zobacz poradnik od jednego z naszych użytkowników:
Voice changer przydaje się też jako „wzór” wymowy. Nasz TTS zwykle dobrze trafia z intonacją, ale czasem możesz chcieć ją dopracować. Dzięki voice changer możesz pokazać, jak powiedzieć dane zdanie, a wybrany głos powtórzy je w ten sposób. Ta opcja będzie jeszcze wygodniejsza, gdy voice changer pojawi się bezpośrednio w Studio, ale już teraz pozwala ci precyzyjnie edytować efekt końcowy.
Badania
Aby przekształcić mowę źródłową w mowę docelową, musimy wyrazić treść mowy źródłowej z cechami mowy docelowej. Dobrym porównaniem są aplikacje do zamiany twarzy, które pozwalają zmieszać twoją twarz z czyjąś inną, tworząc obraz obu jako jednej.
Sposobem na to jest wzięcie obrazu twarzy i mapowanie jej cech. Markery w poniższym przykładzie robią właśnie to: są granicami, w których zostanie odwzorowana inna twarz.
Produkt i najnowsze zmiany
Zmiany w gotowych głosach
Eleven Turbo v2 i format uLaw 8kHz
Turbo v2 to efekt miesięcy pracy naszego zespołu. Sprawdza się w rozmowach na żywo, ale działa w każdym zastosowaniu. Obsługuje też standardowy format (m)uLaw 8kHz do systemów IVR.
Studio obsługuje teraz branżowe wytyczne dla audiobooków, w tym regulację głośności i kompresję dynamiczną. Możesz też dodać metadane (ISBN, autora i tytuł) bezpośrednio w projekcie Studio.
To jedna z najczęściej proszonych funkcji. W zeszłym miesiącu dodaliśmy obsługę tagów SSML do określania wymowy przez IPA i słownik CMU w modelach angielskich. Teraz słownik wymowy jest dostępny w Studio – możesz wgrać plik z wymową przez IPA, CMU lub zamienniki słów (aliasy). Pliki słownika używają otwartego formatu .PLS
Dodanie Słownika Wymowy było jedną z naszych najczęściej zgłaszanych funkcji. W zeszłym miesiącu wdrożyliśmy dodanie tagów SSML do określania wymowy za pomocą słowników IPA i CMU dla naszych modeli angielskich. Teraz udostępniliśmy wsparcie dla słownika wymowy w interfejsie Studio, pozwalając na przesłanie pliku określającego wymowę za pomocą IPA, CMU lub zamienników słów. Pliki słownika są przesyłane przy użyciu standardu branżowego i otwartego formatu .PLS format pliku leksykonu.
Masz uwagi? Napisz do nas na Discordzie!tutaj.
Powiedz to po swojemu i usłysz w zupełnie innym głosie, z pełną kontrolą nad wykonaniem. Przechwyć szepty, śmiech, akcenty i subtelne emocje.



