
Ihr umfassender Workflow, um Bücher in Hörbücher, Skripte in Podcasts zu verwandeln oder andere Audioformate Ihrer Wahl zu erstellen.
Einführung von Eleven v3 Alpha
v3 ausprobierenEine Komplettlösung für die Erstellung von Langform-Audio
Heute starten wir Studio - unseren fortschrittlichen Workflow zur Erstellung und Bearbeitung von Langform-Audio. Studio ist das Ergebnis unserer Forschung in den Bereichen Langform-Sprachsynthese, Audiokonditionierung und parallelisierte Audiogenerierung. Es ermöglicht Kreativen, Verlagen und unabhängigen Autoren, ganze Dialogsegmente, Nachrichtenartikel und sogar KI-Hörbücher innerhalb von Minuten zu vertonen - alles in einem einzigen Workflow.
Studio ergänzt Speech Synthesis, VoiceLab und Voice Library als eigenständiges Tool; eine All-in-One-Lösung für die Erstellung von Langform-Audio. Es ist auch vollständig integriert mit Professional Voice Cloning, Voice Library und unserem mehrsprachigen Modell.
Ihr umfassender Workflow, um Bücher in Hörbücher, Skripte in Podcasts zu verwandeln oder andere Audioformate Ihrer Wahl zu erstellen.
Unsere Nutzer standen vor mehreren Herausforderungen vor dieser Veröffentlichung. Viele kämpften mit Stabilitätsproblemen und Unterbrechungen im Ablauf bei der Erstellung längerer Inhalte. Es gab auch eine spürbare Diskrepanz, wenn Textfragmente, die von verschiedenen Sprechern gesprochen wurden, zusammengefügt werden mussten. Übergänge zwischen Stimmen fehlte oft die Kohäsion, was es schwierig machte, einen fließenden, kontinuierlichen Dialog zu gestalten. Das Neugenerieren ganzer Audiofragmente, selbst wenn nur ein kurzer Abschnitt fehlerhaft war, erwies sich als unpraktisch und ineffizient. Nutzer waren auch durch bestimmte Textdateiformate eingeschränkt, die konvertiert werden mussten, bevor sie auf der Plattform bearbeitet werden konnten.
Studio ermöglicht es Ihnen jetzt, ein ganzes KI-Hörbuch mit einem Klick zu erstellen. Sie können Ihren Erzählungen Leben einhauchen, indem Sie bestimmten Textfragmenten bestimmte Sprecher zuweisen und dabei die kontextuelle Kohärenz beibehalten. Sie können auch die Pausenlängen zwischen Textsegmenten anpassen, um die Kontrolle über das Tempo zu verbessern. Studio führt zudem die Möglichkeit der selektiven Audiogenerierung ein. Sie können jetzt Teile größerer Textfragmente regenerieren, ohne diese Sequenzen vollständig neu erstellen zu müssen. Diese Fragmente passen sich automatisch dem Rhythmus und der Intonation des umgebenden Audios an. Eine Speicher- und Wiederaufnahmefunktion wurde ebenfalls hinzugefügt. Schließlich unterstützt Studio jetzt den Import von .epub-, .pdf- und .txt-Dateien sowie die Initialisierung eines Projekts von einer URL.
Die Navigation in Studio ist einfach und intuitiv.
Narrative
Studio bietet eine unkomplizierte Benutzererfahrung, ähnlich wie bei Google Docs, mit einer intuitiven, benutzerzentrierten Oberfläche, die eine Vielzahl von Bearbeitungsfunktionen unterstützt:
Studio steht neben Speech Synthesis, VoiceLab und Voice Library und dient als umfassende Lösung für die Langform-Audiosynthese. Darüber hinaus ist es nahtlos integriert mit Professional Voice Cloning, Voice Library und unserem mehrsprachigen Modell.
Mit Studio war es unser Ziel, ein Tool zu entwickeln, das die Generierung von Langform-Audio so einfach wie möglich macht. Basierend auf neuer Forschung und Ihrem Feedback haben wir eine umfassende Lösung entwickelt, die auch nahtlos in unser bestehendes Ökosystem von Tools integriert ist. Wir können es kaum erwarten, Ihre Geschichten zum Leben zu erwecken! Interessiert daran, Ihr eigenes Hörbuch zu erstellen? Erstellen Sie einen KI-Erzähler mit unseren KI-Hörbuch-Tools.
Ihr umfassender Workflow, um Bücher in Hörbücher, Skripte in Podcasts zu verwandeln oder andere Audioformate Ihrer Wahl zu erstellen.
Update: Ab Januar 2025 heißt Projects jetzt Studio und ist für alle kostenlosen Nutzer verfügbar.
ESTsoft and ElevenLabs partner to bring natural voiceovers and frame-accurate lip-sync to global video localization.