Przedstawiamy Studio: twórz audiobooki wysokiej jakości w kilka minut

19 wrz 2023 • 5 minut czytania

Wszystko w jednym miejscu do tworzenia długich form audio

A recording studio with a microphone, headphones, a smartphone, a notebook, and a coffee cup on a wooden desk.

Dziś wprowadzamy Studio - nasz zaawansowany workflow do generowania i edytowania długich form audio. Studio to efekt naszych badań nad syntezą mowy, kondycjonowaniem audio i równoległym generowaniem dźwięku, umożliwiający twórcom, wydawcom i niezależnym autorom nadawanie głosu całym segmentom dialogowym, artykułom prasowym, a nawet Audiobooki AI w ciągu kilku minut - wszystko w jednym workflow.

Studio dołącza do Synteza mowy, VoiceLab i Voice Library jako samodzielne narzędzie; kompleksowe rozwiązanie do tworzenia długich form audio. Jest również w pełni zintegrowane z Profesjonalne Voice Cloning, Voice Library i naszym modelem wielojęzycznym.

STUDIO

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

Twój kompletny workflow do edycji wideo i audio, dodawania nałożonych głosów i muzyki, transkrypcji na tekst oraz publikacji produkcji z narracją i napisami

Zauważyliśmy niespotykane zapotrzebowanie na generowanie długich form audio od użytkowników

Nasi użytkownicy napotykali kilka wyzwań przed tym wydaniem. Wielu zmagało się z problemami stabilności i zakłóceniami przepływu przy generowaniu dłuższych treści. Był również zauważalny brak spójności, gdy fragmenty tekstu mówione przez różnych mówców musiały być połączone. Przejścia między głosami często brakowało spójności, co utrudniało tworzenie płynnego, ciągłego dialogu. Regenerowanie całych fragmentów audio, nawet gdy tylko krótki fragment był wadliwy, było niewygodne i nieefektywne. Użytkownicy byli również ograniczeni przez pewne formaty plików tekstowych, które wymagały konwersji przed rozpoczęciem pracy na platformie.

Studio teraz pozwala generować cały Audiobook AI za jednym kliknięciem. Możesz ożywić swoje narracje, przypisując konkretne fragmenty tekstu do określonych mówców, zachowując przy tym spójność kontekstową. Możesz także dostosować długość pauz między segmentami tekstu, aby lepiej kontrolować tempo. Studio wprowadza również możliwość selektywnej regeneracji audio. Teraz możesz regenerować części większych fragmentów tekstu bez konieczności ponownego tworzenia całych sekwencji. Te fragmenty automatycznie dopasują się do tempa i intonacji otaczającego dźwięku. Dodano również funkcję zapisywania i wznawiania pracy. Na koniec, Studio teraz obsługuje import plików .epub, .pdf i .txt, a także inicjowanie projektu z URL.

Pierwsze kroki

Nawigacja po Studio jest łatwa i intuicyjna.

Wybierz Studio z menu na górnym pasku.
Kliknij Utwórz nowy projekt.
Wybierz, jak chcesz zainicjować swój Project.
Zacznij tworzyć swój tekst.
Kliknij Konwertuj, aby przetworzyć cały Project naraz, lub użyj Odtwórz i Regeneruj, aby przetestować konkretne fragmenty.

Narrative

00:00 / 00:00

Najważniejsze funkcje

Studio oferuje prostą obsługę, podobną do korzystania z Google Docs, z intuicyjnym, zorientowanym na użytkownika interfejsem wspierającym różnorodne funkcje edycji:

Pełna konwersja: Użyj jednego przycisku, aby przetworzyć cały Project naraz, lub użyj Odtwórz i Regeneruj, aby przetestować konkretne fragmenty.
Przypisanie mówcy: Przypisz różne fragmenty tekstu do różnych mówców; wybierz domyślne głosy dla nagłówków i akapitów.
Regeneracja fragmentów audio: Bezproblemowo regeneruj konkretne segmenty w większych fragmentach audio, zachowując kontekst.
Wstawianie pauz (dostępne później w tym tygodniu): Ręcznie dostosuj długość pauz (początkowo do 3s) między segmentami mowy, aby precyzyjnie dostosować tempo.
Segmentacja według rozdziału: Strukturyzuj swój tekst na sekcje, aby skupić się na jednym fragmencie naraz.
Zapisz i wznowienie postępu: Wygodnie przerwij pracę i wznow ją dokładnie tam, gdzie skończyłeś.
Import plików: Studio obsługuje pliki .epub, .pdf i .txt, a także URL dla bardziej płynnego workflow
Inteligentna regeneracja: Podczas wznawiania pracy nad już wygenerowanym projektem, zostaniesz obciążony tylko za regenerację zmienionych fragmentów, a nie całego projektu

Kompatybilność

Studio stoi obok Speech Synthesis, VoiceLab i Voice Library, służąc jako kompleksowe rozwiązanie do syntezy długich form audio. Dodatkowo, jest bezproblemowo zintegrowane z Professional Voice Cloning, Voice Library i naszym modelem wielojęzycznym.

Profesjonalne klonowanie głosu: generuj długie formy audio w swoim własnym głosie. Możesz także udostępnić swój profesjonalny klon głosu przez Voice Library i zdobywać nagrody za znaki, gdy inni tworzą projekty używając twojego głosu.
Biblioteka głosów: Wybierz idealny głos do swojej narracji spośród niezliczonych głosów stworzonych przez naszą społeczność. Wybierz idealnego narratora głos do romantycznych opowieści, epickich przygód, czy futurystycznych audiobooków sci-fi. Wprowadź różnorodność postaci, w tym Świętego Mikołaja, DJ-ów radiowych, spikerów sportowych, prezenterów wiadomości, czy agentów obsługi klienta.
Jedenastojęzyczny: Niezależnie od tego, czy wybierzesz gotowy głos, sklonowany głos czy swój własny, możesz płynnie mówić wszystkimi językami obsługiwanymi przez nasz model wielojęzyczny.

Studio jest dostępne już dziś

Naszym celem przy tworzeniu Studio było zaprojektowanie narzędzia, które maksymalnie ułatwi generowanie długich form audio. Czerpiąc z najnowszych badań i waszych opinii, stworzyliśmy kompleksowe rozwiązanie, które również bezproblemowo integruje się z naszym istniejącym ekosystemem narzędzi. Nie możemy się doczekać, aż usłyszymy, jak ożywiasz swoje historie! Zainteresowany stworzeniem własnego audiobooka? Stwórz narratora AI za pomocą naszych narzędzi AI Audiobooks.

STUDIO

Twój kompletny workflow do edycji wideo i audio, dodawania nałożonych głosów i muzyki, transkrypcji na tekst oraz publikacji produkcji z narracją i napisami

Aktualizacja: od stycznia 2025, Projects nazywa się teraz Studio i jest dostępne dla wszystkich darmowych użytkowników.