ElevenLabs verlässt die «Beta»-Phase und startet Eleven Multilingual v2, ein KI-gestütztes Konversationsmodell in 30 Sprachen

Veröffentlicht: 22. Aug. 2023

AnhörenArtikel anhören

0:00

0:000:00

Die KI-gestützte SprachplattformElevenLabs macht einen bedeutenden Schritt in ihren Bemühungen, Sprachbarrieren in verschiedenen Inhalten zu überwinden, mit der Einführung eines neuen Deep-Learning-Modells, das mehrsprachige Fähigkeiten in 30 Sprachen bietet:Eleven Mehrsprachig v2.
Dieser Fortschritt ermöglicht es Medien, Spieleentwicklern, Verlagen und unabhängigen Kreatoren weltweit, die Zugänglichkeit ihrer Inhalte erheblich zu verbessern.
Diese neuen Fähigkeiten, die nach einer Reihe von Funktionseinführungen und Verbesserungen seit dem Start der Plattform im Januar kommen, markieren auch offiziell das Ende der „Beta“-Phase des Unternehmens.
Das Ziel von ElevenLabs ist es, alle Inhalte universell zugänglich zu machen, in jeder Sprache und mit jeder Stimme.

London, Vereinigtes Königreich-ElevenLabs, ein weltweit führendes Unternehmen für KI-gestützte Sprachsoftware, hat heute ein neues mehrsprachiges Sprachgenerierungsmodell in 30 Sprachen eingeführt,das in der Lage ist, präzise, emotional reichhaltiges Audio zu erzeugen.

Dieser Fortschritt, der vollständig auf interner Forschung basiert, ermöglicht es Kreatoren, lokalisierten Audioinhalt für internationale Märkte in Europa, Asien und dem Nahen Osten zu produzieren. ElevenLabs hat die letzten 18 Monate damit verbracht, die Merkmale menschlicher Sprache zu analysieren, was es ermöglicht hat, neue Mechanismen zu entwickeln, um Kontext zu verstehen und Emotionen in der Sprachgenerierung zu vermitteln sowie neue und einzigartige Stimmen zu synthetisieren.

Mit Eleven Multilingual v2 kann das neue Modell beim Eingeben eines Textes in die Text-to-Speech-Plattform von ElevenLabsautomatisch etwa 30 Sprachen identifizieren und Stimme mit einem beispiellosen Maß an Authentizität erzeugen.

Gleichzeitig, unabhängig davon, ob eine synthetische oder eine geklonte Stimme verwendet wird, bleiben die einzigartigen Stimmmerkmale des Sprechers in allen Sprachen erhalten, einschließlich seines ursprünglichen Akzents. Das bedeutet, dass dieselbe Stimme verwendet werden kann, um Inhalte in 30 verschiedenen Sprachen zum Leben zu erwecken.

DieseEinführung folgt auf die Veröffentlichung von Professional

Die unterstützten Sprachen umfassenKoreanisch, Niederländisch, Türkisch, Schwedisch, Indonesisch, Vietnamesisch, Philippinisch, Ukrainisch, Griechisch, Tschechisch, Finnisch, Rumänisch, Dänisch, Bulgarisch, Malaiisch, Ungarisch, Norwegisch, Slowakisch, Kroatisch, Klassisches Arabisch und Tamil. Diese gesellen sich zu den zuvor verfügbaren Sprachen, darunter Englisch, Polnisch, Deutsch, Spanisch, Französisch, Italienisch, Hindi und Portugiesisch.

Nach den jüngsten Einführungen neuer Funktionen und mit den kontinuierlichen Verbesserungen der Plattform hat ElevenLabs heute auch bestätigt, dass die Plattform offiziell die „Beta“-Phase verlassen wird. Dieser Übergang markiert einen entscheidenden Moment in der Verpflichtung des Unternehmens, zuverlässige und fortschrittliche Werkzeuge für seine über 1 Million globalen Nutzer bereitzustellen.

In Zukunft plant ElevenLabs, einen Mechanismus einzuführen, der es Nutzern ermöglicht, Stimmen auf der Plattform zu teilen und von der Entwicklung neuer Audiodateien zu profitieren, was die Zusammenarbeit zwischen Menschen und KI fördern würde.

Mati Staniszewski, CEO und Mitbegründer von ElevenLabs, kommentiert:

„ElevenLabs wurde mit dem Traum geboren, alle Inhalte universell zugänglich zu machen, in jeder Sprache und mit jeder Stimme. Mit der Einführung von Eleven Multilingual v2 sind wir diesem Traum einen Schritt näher gekommen und machen KI-gestützte, menschenähnliche Stimmen in allen Dialekten verfügbar.“

„Unsere Text-to-Speech-Generierungstools tragen zur Chancengleichheit bei und bieten allen Kreatoren hochwertige gesprochene Audiofähigkeiten. Diese Vorteile erstrecken sich nun auf mehrsprachige Anwendungen in fast 30 Sprachen. Im Laufe der Zeit hoffen wir, noch mehr Sprachen und Stimmen mit Hilfe der KI abzudecken und Sprachbarrieren in Inhalten zu beseitigen. Bei ElevenLabs glauben wir, dass diese Fortschritte in der Zugänglichkeit letztendlich zu mehr Kreativität, Innovation und Vielfalt führen werden.“

Durch die Reduzierung der Kosten und Ressourcen, die erforderlich sind, um hochwertige Audioinhalte in mehreren Sprachen zu erstellen, ermöglicht ElevenLabs Unternehmen und Kreatoren, kreativere und zugänglichere Inhalte in allen Kulturen und Sprachen zu produzieren.

Fürunabhängige Spieleentwickler und Verlegerbietet das mehrsprachige Sprachgenerierungstool neue Möglichkeiten, Spielerlebnisse und Audioinhalte für internationale Zielgruppen zu übersetzen und so mit Spielern und Zuhörern in ihren eigenen Sprachen zu verbinden, ohne die Qualität oder Genauigkeit des gesprochenen Audios zu beeinträchtigen.

Ebensohaben Bildungseinrichtungennun die Mittel, um ihren Schülern sofort präzise Audioinhalte in den Zielsprache bereitzustellen, was die Fähigkeiten des Verstehens und der Aussprache in verschiedenen Sprachen stärkt und die unterschiedlichen Lehrstile und Lernbedürfnisse von Schülern weltweit erfüllt.

Jeder Kreator kann das Tool von ElevenLabs nutzen, um dieZugänglichkeitihrer Inhalte für Menschen mit Sehbehinderungen oder zusätzlichen Lernbedürfnissen zu verbessern, indem visuelle Inhalte durch in mehreren Sprachen verfügbare Audios ergänzt werden.

Das anfängliche Set von KI-gestützten Sprachtools, das im Januar 2023 vorgestellt wurde, beinhaltete die Fähigkeit, jeden Text in Sprache umzuwandeln, dank einer Auswahl vorgefertigter synthetischer Stimmen und der Möglichkeit, einen Klon der Stimme des Nutzers zu erstellen. Das mehrsprachige Sprachsynthesetool ist ein weiterer Schritt in ElevenLabs' Ziel, alle Inhalte universell zugänglich zu machen, in jeder Sprache und mit jeder Stimme.

Diese Technologie wurde bereits in mehreren vertikalen und kreativen Sektoren übernommen, was es unabhängigen Autoren ermöglicht hat, Hörbücher zu erstellen, Nebencharakteren in Videospielen eine Stimme zu geben, Menschen mit Sehbehinderungen zu unterstützen, auf geschriebene Inhalte online zuzugreifen, und sogar den ersten KI-gestützten Radiosender der Welt zu aktivieren. ElevenLabs hat sich mit einigen der führenden Studios und Inhaltserstellern zusammengetan, wie den KI-gestützten VideogeneratorenD-ID, einem der größten Hörbuchverlage der Welt,Storytel,der offenen wissenschaftlichen VideoplattformScienceCast, deren Videogenerierungstool wissenschaftliche Arbeiten, die inarXivveröffentlicht wurden, zusammenfasst, der weltweit führenden Plattform für Inhaltserstellung,TheSoul Publishing,den Entwicklern einiger der erstaunlichsten Spiele, wieEmbark StudiosundParadox Interactive,und der MedienplattformMNTN.

ElevenLabs verlässt die «Beta»-Phase und startet Eleven Multilingual v2, ein KI-gestütztes Konversationsmodell in 30 Sprachen

Ähnliche Artikel

Dubbing v2 vorgestellt

Vorstellung von Music v2

Eleven v3 ist jetzt allgemein verfügbar

Einführung von Scribe v2