Direkt zum Inhalt

ElevenLabs sammelt 2 Mio. USD und kündigt KI-Sprachplattform an, die das Audio-Storytelling revolutionieren soll

Veröffentlicht

AnhörenArtikel anhören

  • ElevenLabs startet Beta-Plattform, die es Kreatoren und Verlegern ermöglicht, ihre Langform-Inhalte zu vertonen
  • Die Pre-Seed-Finanzierungsrunde wurde von Credo Ventures geleitet, mit Beteiligung von Concept Ventures und einzelnen Investoren
  • Das Kapital fließt in Forschung und Entwicklung der KI


23.01.2023, London, UK |ElevenLabs, ein KI-Sprachtechnologie-Startup, entwickelt lebensechte Sprachsynthese-Tools mit dem langfristigen Ziel, gesprochene Audios sofort zwischen Sprachen zu konvertieren. Heute kündigten sie den Start ihrer Beta-Plattform an, nachdem sie in einer Pre-Seed-Finanzierungsrunde 2 Millionen Dollar gesammelt hatten, die von Credo Ventures geleitet wurde, mit Beteiligung von Concept Ventures und anderen einzelnen Investoren.

Die Plattform des Unternehmens ermöglicht es Kreatoren und Verlagen, lange Inhalte zu vertonen und ins Audioformat zu bringen. Die Funktionen basieren auf einem eigens entwickelten Deep-Learning-Modell für Sprachsynthese, das menschliche Intonation und Betonung realistisch wiedergibt und die Sprechweise je nach Kontext anpasst. ElevenLabs bietet außerdem eine Reihe von Tools für

Fortschritte in der Leistungsfähigkeit erfordern Innovation, weshalb sich ElevenLabs in erster Linie als Forschungsunternehmen betrachtet. Ein Großteil dieser Forschung konzentrierte sich bisher auf die Entwicklung neuer Text-to-Speech-Modelle, die auf hoher Kompression und Kontextverständnis basieren, um menschliche Sprache ultra-realistisch wiederzugeben. Das Unternehmen hat auch ein neues Modell für das Klonen von Stimmen entwickelt, das eine hohe Ähnlichkeit der Ausgabe ohne Training (kein Feintuning) erreicht, bei Proben von nur 5 Sekunden - eine bisher unerhörte Leistung. Entwickler können auf alle diese Funktionen über API zugreifen.

Diese Forschung bildet die Grundlage für die aktuellen Funktionen der Plattform und trägt dazu bei, das übergeordnete Ziel des Unternehmens zu erreichen: gesprochene Audios in Echtzeit zwischen Sprachen zu übertragen. Das KI-Synchronisationstool, das später in diesem Jahr erscheinen soll, ermöglicht es, beliebige Audio- oder Videoinhalte automatisch in eine andere Sprache zu vertonen – und dabei die Originalstimme zu erhalten. ElevenLabs möchte zunächst Kundinnen und Kunden aus dem Bildungsbereich gewinnen. Langfristig soll On-Demand-Mehrsprachigkeit für Audio in Streaming,

Die Sprachsynthese- und Synchronisationstools des Unternehmens sind ebenso komplementär wie gut getimed: Beide versprechen, Audio und Video einem breiteren Publikum zugänglich zu machen, und beide kommen zu einer Zeit, in der der Audiobereich boomt. Eine frühe Gruppe von Testern, darunter YouTube-Kreatoren, Verleger und Entwickler, nutzt die Plattform bereits täglich, um Videos, Geschichten und Charaktere zu vertonen, und das Unternehmen erwartet, dass sich das Spektrum der potenziellen Anwendungen für generative Sprache nur erweitern wird. Nachrichtenverleger haben bereits festgestellt, dass die Erweiterung ihrer Audio-Präsenz eine großartige Möglichkeit ist, Abonnenten zu binden und zu halten. Aber die Beauftragung von Synchronsprechern ist teuer, ebenso wie das Vorlesen von Geschichten durch Reporter. Buch- und Newsletter-Autoren und sogar Spieleentwickler stehen vor ähnlichen Herausforderungen: Erstere greifen zunehmend darauf zurück, ihre eigenen Werke zu vertonen, und Letztere müssen entscheiden, ob ein bestimmter Charakter die Aufnahmekosten rechtfertigt. Diejenigen, die bestehende Text-to-Speech-Software verwenden, sparen Geld, zahlen jedoch einen anderen Preis, indem sie bei der Qualität Kompromisse eingehen. ElevenLabs besteht darauf, dass es nicht mehr notwendig ist, Kompromisse einzugehen, da sie sich darauf vorbereiten, Kreatoren und Verleger mit den fortschrittlichsten und vielseitigsten KI-Erzählwerkzeugen auszustatten.

„Die Plattform, die wir jetzt starten, dreht sich darum, Text in hochwertiges gesprochenes Audio zu verwandeln. Wir möchten den Menschen ermöglichen, ihr Lieblingsbuch oder ihren Newsletter zu genießen, indem wir allen Autoren, Kreatoren und Entwicklern, die sich keine Stimme leisten konnten, eine Stimme geben“ - sagt Mati Staniszewski, ein Mitbegründer. „Unser ultimatives Ziel ist es, den Menschen zu ermöglichen, jeden Inhalt zu genießen, den sie relevant und interessant finden, unabhängig davon, welche Sprache sie sprechen“ - fügt Piotr Dabkowski hinzu, ebenfalls Mitbegründer.

Bei Credo Ventures suchen wir nach klugen und ehrgeizigen Gründern aus der CEE-Region. Wir sahen den Hunger und das Funkeln in Matis und Piotrs Augen bei unserem allerersten Treffen. Ein paar Monate später werden sie zu einem Forschungszentrum für Sprachtechnologie auf OpenAI-Niveau, das die größten Herausforderungen im Bereich künstlicher Audioinhalte überwindet. Ihre synthetisierten Stimmen sind bereits nicht mehr von echten zu unterscheiden, und dieser Durchbruch hat nicht nur die Barrieren für die Erstellung von Inhalten in beispielloser Qualität und Treue massiv gesenkt, sondern wird es Kreatoren bald auch ermöglichen, ihr Publikum radikal zu erweitern, indem sie mehrsprachig werden.– sagt Maciek Gnutek, General Partner bei Credo Ventures.

Obwohl Audio sowohl im Unterhaltungs- als auch im Geschäftsbereich allgegenwärtig ist, wurde es von den jüngsten Fortschritten in der Forschung relativ vernachlässigt. Wir könnten nicht aufgeregter sein, Mati & Piotr in dieser goldenen Ära für generative KI zu unterstützen, und glauben, dass ElevenLabs das Team ist, das diese Technologie der breiten Masse zugänglich machen wird, eine Stimme nach der anderen - sagt Oliver Kicks, Principal bei Concept Ventures.

Über ElevenLabs:
ElevenLabs ist ein Forschungsunternehmen, das KI-basierte Sprachsynthese-Software für Kreative und Verlage entwickelt. Die Tools des Unternehmens erzeugen äußerst realistische Sprache und können Intonation und Betonung je nach Kontext oder Nutzeranweisung anpassen. Die Plattform des Unternehmens bietet die nötige Qualität und Vielseitigkeit, um zur zentralen Lösung für die Vertonung von Nachrichten, Newslettern, Büchern und Videos zu werden. Zu den wichtigsten Funktionen gehören: textbasierte Spracherzeugung, KI-Stimme klonen,

Risikokapital bereitgestellt von Credo Ventures und Concept Ventures. Zu den einzelnen Investoren gehören Peter Czaban, Tytus Cytowski, Talfan Evans, Dr. Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst und Harry Songhurst.

Kontakt
press@elevenlabs.io

Ähnliche Artikel

Erstellen Sie mit hochwertiger KI-Audio