Voice Design - Die erste generative KI für Audio

Veröffentlicht: 28. Feb. 2023

AnhörenArtikel anhören

0:00

0:000:00

Letzten Monat haben wir angekündigt, dass unser generatives Modell zur Stimmerstellung kommt. Es ist endlich da und das erste seiner Art - wir nennen es Stimmendesign. Mit dieser Funktion können Sie neue Stimmen von Grund auf erstellen, indem Sie zentrale Eigenschaften wie Geschlecht, Alter und Akzent auswählen. Selbst bei identischen Einstellungen sorgt unser Modell bei jeder Generierung für Zufälligkeit, sodass jede Stimme einzigartig bleibt.

Try Voice Design

Stimmendesign

Das Modell hinter Voice Design basiert größtenteils auf unserer Forschung zur Sprachsynthese und

Eine gewisse Kontrolle bei der Stimmauswahl hinzuzufügen war wichtig, da unsere Nutzer oft konkrete Sprachmerkmale für ihre Skripte suchen. Sicherzustellen, dass jede generierte Stimme einzigartig ist, war ebenso entscheidend, da viele Anwendungsfälle erfordern oder zumindest davon profitieren, exklusiven Zugang zu einer Stimme zu haben. Zusätzlich zur Bereitstellung eines neuen kreativen Ausdrucks sind die mit Voice Design generierten Stimmen vollständig künstlich und gehören keiner realen Person.

Anwendungen

Neben der mühelosen Umwandlung von Text in qualitatives Audio mit unserem bewährten Sprachsynthese Werkzeug können Buchautoren jetzt Voice Design nutzen, um künstlerische Kontrolle über die Erzählung auszuüben und die Persönlichkeit jedes Charakters mit maßgeschneiderten Stimmen zu gestalten.

Nachrichtenverlage die sich in den Audio-Bereich wagen, benötigen Stimmen für ihre Geschichten. Da Erzähler mit den Publikationen, die sie repräsentieren, identifiziert werden, wird die Wahl der richtigen Stimme zu einer wichtigen Aufgabe, die nicht oft wiederholt wird. Voice Design ermöglicht es Verlagen, praktisch unzählige Erzähler sofort auszuwählen und zu vergleichen. Es gibt ihnen auch die Sicherheit, dass eine bestimmte Stimme sie und nur sie repräsentiert.

Spieleentwickler müssen nicht mehr entscheiden, ob ein bestimmter Charakter die Aufnahmekosten rechtfertigt. Zehntausende zuvor stumme NPCs können jetzt einzigartige Persönlichkeiten haben und die Grenzen der virtuellen Immersion erweitern.

Ob Sie ein Content Creator sind, der an Ihrer nächsten Veröffentlichung arbeitet, oder ein Unternehmensleiter, der Unternehmenskommunikation vertonen möchte, die Möglichkeiten zur Gestaltung von lebensechtem, überzeugendem Audio für spezifische Anwendungsfälle und Zielgruppen sind jetzt grenzenlos.

Ökosystem

Voice Design ist eines von mehreren Funktionen zur Erzählbearbeitung, die wir dieses Jahr einführen wollen. Als nächstes kommt Studio - unsere neue Arbeitsstation zum Strukturieren großer Texte, Einfügen von Pausen, Regenerieren von Audioabschnitten und Zuweisen von Textteilen an verschiedene Sprecher. Studio kommt Ende März und wird im Laufe des zweiten Quartals dieses Jahres durch Unterstützung für Intonationsbearbeitung ergänzt.

Voice Design - Die erste generative KI für Audio

Stimmendesign

Anwendungen

Ökosystem

Ähnliche Artikel

Flows Agent in ElevenCreative

200.000 Premium-Hörbücher jetzt in ElevenReader verfügbar

Einführung der ElevenCreative-Vorlagen

Studio Agents vorgestellt