
ElevenLabs veröffentlicht in Beta-Version, Einführung von Eleven Multilingual v2, einem grundlegenden KI-Sprachmodell für 30 Sprachen
- Die Voice-KI-Plattform ElevenLabs hat ein neues, grundlegendes Deep-Learning-Modell namens Eleven Multilingual v2 eingeführt, das mehrsprachige Funktionen in 30 Sprachen unterstützt, um sprachliche Barrieren in Inhalten zu überwinden.
- Dieser Schritt ermöglicht es Medienunternehmen, Spieleentwicklern, Verlegern und unabhängigen Kreativen weltweit, die Zugänglichkeit ihrer Inhalte erheblich zu verbessern.
- Seit der Einführung der Plattform im Januar markiert diese neue Funktion mit vielen neuen Releases und Verbesserungen das offizielle Ende der Beta-Phase des Unternehmens.
- Die Mission von ElevenLabs ist es, allen Menschen Zugang zu allen Inhalten in jeder Sprache und Stimme zu ermöglichen.
Vereinigtes Königreich London - Als weltweit führendes Unternehmen im Bereich Voice-KI-Software ElevenLabs hat heute ein neues mehrsprachiges Sprachgenerierungsmodell in 30 Sprachen eingeführt, das 'emotional reichhaltige' KI-Audio präzise erzeugen kann.
Basierend auf eigener Forschung ermöglicht dieser Schritt Kreativen, lokalisierten Audioinhalt für internationale Märkte in Europa, Asien und dem Nahen Osten zu erstellen. ElevenLabs hat in den letzten 18 Monaten menschliche Sprachmetriken analysiert, neue Mechanismen zur Kontextverständnis und Emotionserzeugung entwickelt und neue, einzigartige Stimmen synthetisiert.
Mit Eleven Multilingual v2 kann, wenn Text in die ElevenLabs Text-to-Speech-Plattform eingegeben wird, das neue Modell fast 30 Schriftsysteme automatisch erkennen und in dieser Sprache mit beispielloser Authentizität Sprache erzeugen.
Gleichzeitig bleiben die einzigartigen Stimmmerkmale des Sprechers, einschließlich des ursprünglichen Akzents, über alle Sprachen hinweg erhalten, egal ob synthetische oder geklonte Stimme verwendet wird. Das bedeutet, dass Sie mit derselben Stimme Inhalte in 30 Sprachen zum Leben erwecken können.
Diese Veröffentlichung folgt auf die Einführung des Professional Voice Cloning für alle Kreativen auf der Plattform. Mit zusätzlichen Sicherheits- und Schutzfunktionen ermöglicht dieses Produktupdate den Nutzern, eine nahezu ununterscheidbare digitale Kopie ihrer eigenen Stimme zu erstellen.
Die heutige Veröffentlichung bedeutet, dass das mehrsprachige Modell in fast 30 Sprachen verfügbar ist.
Zu den unterstützten Sprachen gehören Koreanisch, Niederländisch, Türkisch, Schwedisch, Indonesisch, Vietnamesisch, Philippinisch, Ukrainisch, Griechisch, Tschechisch, Finnisch, Rumänisch, Dänisch, Bulgarisch, Malaiisch, Ungarisch, Norwegisch, Slowakisch, Kroatisch, Klassisches Arabisch und Tamil. Sie gesellen sich zu den zuvor verfügbaren Sprachen Englisch, Polnisch, Deutsch, Spanisch, Französisch, Italienisch, Hindi und Portugiesisch.
Nach den jüngsten Funktionseinführungen und der kontinuierlichen Verbesserung der Plattform hat ElevenLabs heute bestätigt, dass die Plattform offiziell die Beta-Phase verlassen hat. Dieser Übergang markiert einen entscheidenden Moment in der Verpflichtung des Unternehmens, über 1 Million globalen Nutzern zuverlässige, hochmoderne Werkzeuge bereitzustellen.
In Zukunft plant ElevenLabs, Mechanismen einzuführen, die es Nutzern ermöglichen, Stimmen auf der Plattform zu teilen und die Vorteile neuer Audioentwicklungen zu nutzen, um die Möglichkeiten der Mensch-KI-Zusammenarbeit zu fördern.
Mati Staniszewski, CEO und Mitbegründer von ElevenLabs, sagt:
„ElevenLabs begann mit dem Traum, allen Menschen Zugang zu allen Inhalten in jeder Sprache und Stimme zu ermöglichen. Mit der Einführung von Eleven Multilingual v2 sind wir diesem Traum näher gekommen, indem wir menschliche Qualität in jeder Sprache und jedem Dialekt mit KI-Stimmen ermöglichen.“품질의 AI 음성을 사용할 수 있도록 하는 데 한 걸음 더 다가갔습니다.
„TTS (Text-to-Speech) Erstellungstools ebnen das Spielfeld und bieten allen Kreativen die Möglichkeit, hochwertige Sprach-Audiofunktionen bereitzustellen. Diese Vorteile werden nun auf fast 30 Sprachen in mehrsprachigen Anwendungen erweitert. Wir hoffen, mit Hilfe der KI mehr Sprachen und Stimmen abzudecken und sprachliche Barrieren für Inhalte zu beseitigen. ElevenLabs glaubt, dass dieser Sprung in der Zugänglichkeit letztendlich größere Kreativität, Innovation und Vielfalt fördern wird.“ 더 많은 언어와 목소리를 다루고 콘텐츠에 대한 언어적 장벽을 제거하기를 바랍니다. ElevenLabs는 이러한 접근성의 도약이 궁극적으로 더 큰 창의성, 혁신 및 다양성을 촉진할 것이라고 믿습니다.”
Indem ElevenLabs die Kosten und Ressourcen für die Erstellung hochwertiger Audioinhalte in mehreren Sprachen reduziert, unterstützt es Unternehmen und Kreative dabei, Inhalte zu schaffen, die über Kulturen und Sprachen hinweg mehr Vorstellungskraft und Zugänglichkeit bieten.
Für unabhängige Spieleentwickler und Verleger bieten mehrsprachige Sprachgenerierungstools neue Möglichkeiten, Spielerlebnisse und Audioinhalte für ein internationales Publikum zu übersetzen, ohne die Qualität oder Genauigkeit der Sprach-Audio zu beeinträchtigen, und ermöglichen es, in ihrer eigenen Sprache mit Spielern und Zuhörern zu kommunizieren.
Ebenso können Bildungseinrichtungen nun Lernenden sofort präzise Audioinhalte in der Zielsprache bereitstellen, das Sprachverständnis und die Aussprachefähigkeiten verbessern und verschiedene Lehrstile und Lernbedürfnisse für internationale Studierende erfüllen.
Kreative aller Art können mit den Tools von ElevenLabs visuelle Inhalte mit Sprachunterstützung in mehreren Sprachen ergänzen und so die Zugänglichkeit von Inhalten für Menschen mit Sehbehinderungen oder zusätzlichem Lernbedarf verbessern.
Die im Januar 2023 eingeführte erste Suite von KI-Sprachtools umfasste die Möglichkeit, jeden Text in Sprache umzuwandeln und eine Kopie der eigenen Stimme zu erstellen. Das mehrsprachige Sprachsynthesetool ist ein weiterer Fortschritt in der Mission von ElevenLabs, allen Menschen Zugang zu allen Inhalten in jeder Sprache und Stimme zu ermöglichen.
Diese Technologie wurde bereits in verschiedenen kreativen Bereichen und Sektoren eingesetzt, darunter die Ermöglichung von Indie-Autoren, Hörbücher zu erstellen, die Vertonung von Nebencharakteren in Videospielen, die Unterstützung von Sehbehinderten beim Zugriff auf Online-Textinhalte und die Stromversorgung des weltweit ersten KI-Radiosenders. ElevenLabs hat auch Partnerschaften mit dem KI-Videogenerator D-ID, einem der größten Hörbuchverlage der Welt, Storytel, der Open-Access-Wissenschaftsvideo-Plattform ScienceCast, die wissenschaftliche Forschungspapiere von arXiv zusammenfasst, der führenden globalen Content-Creator-Plattform TheSoul Publishing, Embark Studios und Paradox Interactive, sowie bemerkenswerten Spieleentwicklern, Medienplattformen MNTN und anderen führenden Content-Creators und Studios geschlossen.
Mehr entdecken


Dubbing made simpler, sharper, and faster at PERSO.ai
ESTsoft and ElevenLabs partner to bring natural voiceovers and frame-accurate lip-sync to global video localization.