Einführung von Eleven v3 Alpha

v3 ausprobieren

ElevenLabs verlässt die Beta-Phase und veröffentlicht Eleven Multilingual v2 - ein grundlegendes KI-Sprachmodell für fast 30 Sprachen

Der Fortschritt ermöglicht es Medienunternehmen, Spieleentwicklern, Verlagen und unabhängigen Kreatoren weltweit, die Zugänglichkeit ihrer Inhalte erheblich zu verbessern.

II Multilingual V2 with instructions to transform your voice into another character and control its emotion and delivery.
  • Voice-KI-Plattform ElevenLabs macht einen radikalen Schritt nach vorn, um die sprachlichen Barrieren von Inhalten zu beseitigen, mit der Veröffentlichung eines neuen grundlegenden Deep-Learning-Modells, das mehrsprachige Fähigkeiten in 28 Sprachen unterstützt - das Eleven Multilingual v2
  • Der Fortschritt ermöglicht es Medienunternehmen, Spieleentwicklern, Verlagen und unabhängigen Kreatoren weltweit, die Zugänglichkeit ihrer Inhalte erheblich zu verbessern
  • Diese neuen Fähigkeiten, die auf eine Reihe neuer Funktionen und Verbesserungen seit dem Start der Plattform im Januar folgen, markieren auch das offizielle Ende der Beta-Phase des Unternehmens
  • Die Mission von ElevenLabs ist es, alle Inhalte in jeder Sprache und in jeder Stimme universell zugänglich zu machen

ElevenLabs, der weltweit führende Anbieter von Voice-KI-Software, hat heute ein neues mehrsprachiges Sprachgenerierungsmodell eingeführt, das in der Lage ist, 'emotional reichhaltige' KI-Audio in fast 30 Sprachen genau zu erzeugen.

Der Fortschritt, der vollständig auf interner Forschung basiert, ermöglicht es Kreatoren, lokalisierte Audioinhalte für internationale Märkte in Europa, Asien und dem Nahen Osten zu produzieren. ElevenLabs hat die letzten 18 Monate damit verbracht, die Merkmale menschlicher Sprache zu analysieren, neue Mechanismen zum Verständnis von Kontext und zur Vermittlung von Emotionen in der Sprachgenerierung zu entwickeln sowie neue, einzigartige Stimmen zu synthetisieren.

Mit Eleven Multilingual v2, wenn Text in die ElevenLabs Text-to-Speech Plattform eingegeben wird, kann das neue Modell automatisch fast 30 geschriebene Sprachen identifizieren und in ihnen mit einem beispiellosen Maß an Authentizität Sprache erzeugen.

Gleichzeitig werden, unabhängig davon, ob eine synthetische Stimme oder eine geklonte Stimme verwendet wird, die einzigartigen Stimmmerkmale des Sprechers in allen Sprachen beibehalten, einschließlich ihres ursprünglichen Akzents. Das bedeutet, dass dieselbe Stimme verwendet werden kann, um Inhalte in 28 verschiedenen Sprachen zum Leben zu erwecken.

Diese Einführung folgt der öffentlichen Freigabe von Professional Voice Cloning für alle Kreatoren auf der Plattform. Dieses Produktupdate, das zusammen mit zusätzlichen Sicherheitsfunktionen verfügbar gemacht wurde, ermöglicht es Benutzern, eine perfekte digitale Kopie ihrer eigenen Stimme zu erstellen; eine, die praktisch nicht vom Original zu unterscheiden ist. Die heutige Veröffentlichung bedeutet, dass Ihre Stimme in den fast 30 von dem mehrsprachigen Modell angebotenen Sprachen sprechen kann.

Unterstützte Sprachen umfassen jetzt; Chinesisch, Koreanisch, Niederländisch, Türkisch, Schwedisch, Indonesisch, Filipino, Japanisch, Ukrainisch, Griechisch, Tschechisch, Finnisch, Rumänisch, Dänisch, Bulgarisch, Malaiisch, Slowakisch, Kroatisch, Klassisches Arabisch und Tamil.

Sie ergänzen die bereits verfügbaren Sprachen einschließlich Englisch, Polnisch, Deutsch, Spanisch, Französisch, Italienisch, Hindi und Portugiesisch.

Nach den jüngsten Funktionseinführungen und laufenden Verbesserungen der Plattform hat ElevenLabs heute auch bestätigt, dass die Plattform offiziell aus der Beta-Phase herauskommt. Dieser Übergang markiert einen entscheidenden Moment in der Verpflichtung des Unternehmens, zuverlässige und fortschrittliche Tools für seine über 1 Million globalen Nutzer bereitzustellen.

In Zukunft plant ElevenLabs die Einführung eines Mechanismus, der es Benutzern ermöglicht, Stimmen auf der Plattform zu teilen und von der Entwicklung neuer Audios zu profitieren, um Möglichkeiten für die Zusammenarbeit zwischen Mensch und KI zu fördern.

Mati Staniszewski, CEO und Mitbegründer von ElevenLabs, kommentiert:

ElevenLabs wurde mit dem Traum gegründet, alle Inhalte in jeder Sprache und in jeder Stimme universell zugänglich zu machen. Mit der Veröffentlichung von Eleven Multilingual v2 sind wir diesem Traum einen Schritt näher gekommen und machen KI-Stimmen in menschlicher Qualität in jedem Dialekt verfügbar.

„Unsere Text-to-Speech-Generierungstools helfen, das Spielfeld zu ebnen und erstklassige gesprochene Audiofähigkeiten für alle Kreatoren da draußen bereitzustellen. Diese Vorteile erstrecken sich nun auf mehrsprachige Anwendungen in fast 30 Sprachen. Schließlich hoffen wir, mit Hilfe von KI noch mehr Sprachen und Stimmen abzudecken und die sprachlichen Barrieren für Inhalte zu beseitigen. Bei ElevenLabs glauben wir, dass diese Fortschritte in der Zugänglichkeit letztendlich größere Kreativität, Innovation und Vielfalt fördern werden.

Indem die Kosten und Ressourcen gesenkt werden, die erforderlich sind, um qualitativ hochwertige Audioinhalte in mehreren Sprachen zu erstellen, ermöglicht ElevenLabs Unternehmen und Kreatoren, kreativere und zugänglichere Inhalte zu produzieren, die über Kulturen und Sprachen hinweg Resonanz finden.

Für unabhängige Spieleentwickler und Verlage bietet das mehrsprachige Sprachgenerierungstool neue Möglichkeiten, Spielerlebnisse und Audioinhalte für internationale Zielgruppen zu übersetzen und mit Spielern und Zuhörern in ihren eigenen Sprachen zu verbinden, ohne Kompromisse bei der Qualität oder Genauigkeit des gesprochenen Audios einzugehen.

Ebenso haben Bildungseinrichtungen jetzt die Möglichkeit, Lernenden sofort genaue Audioinhalte in Zielsprache bereitzustellen, um Sprachverständnis und Aussprachefähigkeiten zu stärken sowie unterschiedliche Lehrstile und Lernbedürfnisse internationaler Studenten zu berücksichtigen.

Kreatoren aller Art können das Tool von ElevenLabs nutzen, um die Zugänglichkeit von Inhalten für Menschen mit Sehbehinderungen oder zusätzlichen Lernbedürfnissen zu verbessern, indem visuelle Inhalte durch Sprache in mehreren Sprachen ergänzt werden.

Das anfängliche Set von KI-Sprachtools, das im Januar 2023 vorgestellt wurde, umfasste die Möglichkeit, jeden Text in Sprache umzuwandeln, indem eine Auswahl vorgefertigter, synthetischer Stimmen verwendet wird, sowie die Möglichkeit, einen Klon der eigenen Stimme zu erstellen. Das mehrsprachige Sprachsynthesetool ist ein weiterer Schritt auf der Mission von ElevenLabs, alle Inhalte in jeder Sprache und in jeder Stimme universell zugänglich zu machen.

Die Technologie wurde bereits in mehreren kreativen Bereichen und Sektoren eingesetzt, einschließlich der Möglichkeit für Indie-Autoren, Hörbücher zu erstellen, Nebencharaktere in Videospielen zu vertonen, Sehbehinderten den Zugang zu online geschriebenen Inhalten zu ermöglichen und den weltweit ersten KI-Radiosender zu betreiben. ElevenLabs hat auch Partnerschaften mit einer Reihe führender Inhaltsersteller und Studios geschlossen, darunter KI-Video-Generatoren D-ID, einer der weltweit größten Hörbuchverlage Storytel, offene Wissenschafts-Videoplattform ScienceCast , deren Videogenerierungstool wissenschaftliche Forschungspapiere, die auf arXiv veröffentlicht wurden, zusammenfasst, führende globale Inhaltserstellerplattform TheSoul Publishing, unglaubliche Spieleentwickler wie Embark Studios und Paradox Interactive, und die Medienplattform MNTN.

Kontakt
press@elevenlabs.io

Mehr entdecken

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden