Einführung von Studio: Erstellen Sie hochwertige Hörbücher in Minuten

19. Sept. 2023 • 5 Minuten Lesezeit

Eine Komplettlösung für die Erstellung von Langform-Audio

A recording studio with a microphone, headphones, a smartphone, a notebook, and a coffee cup on a wooden desk.

Heute starten wir Studio - unseren fortschrittlichen Workflow zur Erstellung und Bearbeitung von Langform-Audio. Studio ist das Ergebnis unserer Forschung in den Bereichen Langform-Sprachsynthese, Audiokonditionierung und parallelisierte Audiogenerierung. Es ermöglicht Kreativen, Verlagen und unabhängigen Autoren, ganze Dialogsegmente, Nachrichtenartikel und sogar KI-Hörbücher innerhalb von Minuten zu vertonen - alles in einem einzigen Workflow.

Studio ergänzt Speech Synthesis, VoiceLab und Voice Library als eigenständiges Tool; eine All-in-One-Lösung für die Erstellung von Langform-Audio. Es ist auch vollständig integriert mit Professional Voice Cloning, Voice Library und unserem mehrsprachigen Modell.

STUDIO

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

Ihr kompletter Workflow zum Bearbeiten von Videos und Audio, Hinzufügen von Voiceovers und Musik, Transkribieren in Text und Veröffentlichen von erzählten, untertitelten Produktionen

Wir haben eine beispiellose Nachfrage nach der Generierung von Langform-Audio von Nutzern gesehen

Unsere Nutzer standen vor mehreren Herausforderungen vor dieser Veröffentlichung. Viele kämpften mit Stabilitätsproblemen und Unterbrechungen im Ablauf bei der Erstellung längerer Inhalte. Es gab auch eine spürbare Diskrepanz, wenn Textfragmente, die von verschiedenen Sprechern gesprochen wurden, zusammengefügt werden mussten. Übergänge zwischen Stimmen fehlte oft die Kohäsion, was es schwierig machte, einen fließenden, kontinuierlichen Dialog zu gestalten. Das Neugenerieren ganzer Audiofragmente, selbst wenn nur ein kurzer Abschnitt fehlerhaft war, erwies sich als unpraktisch und ineffizient. Nutzer waren auch durch bestimmte Textdateiformate eingeschränkt, die konvertiert werden mussten, bevor sie auf der Plattform bearbeitet werden konnten.

Studio ermöglicht es Ihnen jetzt, ein ganzes KI-Hörbuch mit einem Klick zu erstellen. Sie können Ihren Erzählungen Leben einhauchen, indem Sie bestimmten Textfragmenten bestimmte Sprecher zuweisen und dabei die kontextuelle Kohärenz beibehalten. Sie können auch die Pausenlängen zwischen Textsegmenten anpassen, um die Kontrolle über das Tempo zu verbessern. Studio führt zudem die Möglichkeit der selektiven Audiogenerierung ein. Sie können jetzt Teile größerer Textfragmente regenerieren, ohne diese Sequenzen vollständig neu erstellen zu müssen. Diese Fragmente passen sich automatisch dem Rhythmus und der Intonation des umgebenden Audios an. Eine Speicher- und Wiederaufnahmefunktion wurde ebenfalls hinzugefügt. Schließlich unterstützt Studio jetzt den Import von .epub-, .pdf- und .txt-Dateien sowie die Initialisierung eines Projekts von einer URL.

Erste Schritte

Die Navigation in Studio ist einfach und intuitiv.

Wählen Sie Studio aus dem Menü in der oberen Leiste.
Klicken Sie auf Neues Projekt erstellen.
Wählen Sie, wie Sie Ihr Projekt initialisieren möchten.
Beginnen Sie mit der Erstellung Ihres Textes.
Klicken Sie auf Konvertieren, um Ihr gesamtes Projekt auf einmal zu rendern, oder verwenden Sie Play & Regenerate, um bestimmte Fragmente zu testen.

Narrative

00:00 / 00:00

Funktionale Highlights

Studio bietet eine unkomplizierte Benutzererfahrung, ähnlich wie bei Google Docs, mit einer intuitiven, benutzerzentrierten Oberfläche, die eine Vielzahl von Bearbeitungsfunktionen unterstützt:

Vollständige Konvertierung: Verwenden Sie eine einzige Schaltfläche, um Ihr gesamtes Projekt auf einmal zu rendern, oder verwenden Sie Play & Regenerate, um bestimmte Fragmente zu testen.
Sprecherzuweisung: Weisen Sie verschiedene Textfragmente verschiedenen Sprechern zu; wählen Sie Standardstimmen für Überschriften und Absätze.
Audiofragmente regenerieren: Regenerieren Sie nahtlos bestimmte Segmente innerhalb größerer Audiofragmente, während der Kontext erhalten bleibt.
Pausen einfügen (erscheint später in dieser Woche): Passen Sie die Länge der Pausen (anfangs bis zu 3 Sekunden) zwischen Sprachsegmenten manuell an, um das Tempo zu verfeinern.
Nach Kapiteln segmentieren: Strukturieren Sie Ihren Text in Abschnitte, um sich jeweils auf ein bestimmtes Fragment zu konzentrieren.
Speichern und Fortschritt fortsetzen: Unterbrechen Sie bequem Ihre Arbeit und setzen Sie genau dort fort, wo Sie aufgehört haben.
Dateien importieren: Studio unterstützt .epub-, .pdf- und .txt-Dateien sowie URLs für einen reibungsloseren Workflow
Intelligente Regeneration: Wenn Sie an einem bereits generierten Projekt weiterarbeiten, werden Ihnen nur die regenerierten geänderten Fragmente berechnet, nicht das gesamte Projekt

Kompatibilität

Studio steht neben Speech Synthesis, VoiceLab und Voice Library und dient als umfassende Lösung für die Langform-Audiosynthese. Darüber hinaus ist es nahtlos integriert mit Professional Voice Cloning, Voice Library und unserem mehrsprachigen Modell.

Professionelles Voice Cloning: Erstellen Sie Langform-Audioinhalte in Ihrer eigenen Stimme. Sie können Ihren professionellen Stimmklon auch über die Voice Library teilen und Charakterbelohnungen verdienen, wenn andere Projekte mit Ihrer Stimme erstellen.
Voice Library: Wählen Sie die perfekte Stimme für Ihre Erzählung aus den unzähligen Stimmen, die von unserer Community erstellt wurden. Wählen Sie den perfekten Erzähler Stimme für romantische Geschichten, epische Abenteuer oder futuristische Sci-Fi-Hörbücher. Führen Sie eine Vielzahl von Charakteren ein, darunter Weihnachtsmann, Radio-DJs, Sportkommentatoren, Nachrichtensprecher, oder Kundendienst Agenten.
Eleven multilingual: Egal, ob Sie eine vorgefertigte Stimme, eine geklonte Stimme oder Ihre eigene Stimme wählen, Sie können sie nahtlos alle von unserem mehrsprachigen Modell unterstützten Sprachen sprechen lassen.

Studio ist ab heute verfügbar

Mit Studio war es unser Ziel, ein Tool zu entwickeln, das die Generierung von Langform-Audio so einfach wie möglich macht. Basierend auf neuer Forschung und Ihrem Feedback haben wir eine umfassende Lösung entwickelt, die auch nahtlos in unser bestehendes Ökosystem von Tools integriert ist. Wir können es kaum erwarten, Ihre Geschichten zum Leben zu erwecken! Interessiert daran, Ihr eigenes Hörbuch zu erstellen? Erstellen Sie einen KI-Erzähler mit unseren KI-Hörbuch-Tools.

STUDIO

Ihr kompletter Workflow zum Bearbeiten von Videos und Audio, Hinzufügen von Voiceovers und Musik, Transkribieren in Text und Veröffentlichen von erzählten, untertitelten Produktionen

Update: Ab Januar 2025 heißt Projects jetzt Studio und ist für alle kostenlosen Nutzer verfügbar.