
ElevenLabs Agent Skills
We’re introducing ElevenLabs Agent Skills, a collection of agent skills to enable you to build faster with ElevenLabs.
Einen Monat nach dem Start bestätigt Scribe weiterhin, das fortschrittlichste Sprache-zu-Text-Modell der Branche zu sein.
In nur einem Monat nach dem Start hat unser Sprache-zu-Text-Modell Scribe mit seiner führenden Genauigkeit bereits Tausende Unternehmen überzeugt. Von Medien-Untertiteln über Callcenter bis hin zu medizinischen Transkriptionen – Scribe ist schnell zum bevorzugten Modell für Entwickler geworden.
Mehrere unabhängige Analysen bestätigen unsere eigenen Genauigkeits-Benchmarks: Scribe übertrifft alle Modelle, einschließlich der neuen 4o-Transkriptionsmodelle von OpenAI. Ein Benchmark von Artificial Analysis zeigt, dass Scribe sowohl 4o als auch 4o mini beim Word Error Rate deutlich übertrifft, im Durchschnitt:

Scribe übertrifft oder liegt gleichauf mit den 4o- und 4o mini-Transkriptionsmodellen in OpenAIs eigenen Benchmarks für 11 von 15 getesteten Sprachen. Zum Beispiel bei Japanisch und Hindi ist Scribe in OpenAIs eigenen Tests beiden 4o-Modellen deutlich überlegen:
Wir haben Scribe so entwickelt, dass es für Kunden möglichst nützlich ist – auch wenn das zu Abweichungen in Branchen-Benchmarks führen kann. Zum Beispiel:
Deshalb ist es sinnvoll, die Endergebnisse zu betrachten, wenn es um Leistung geht. Im Englischen etwa ist das OpenAI 4o Sprache-zu-Text-Modell in Benchmarks ähnlich stark wie Scribe. Ein Vergleich der englischen Transkripte zeigt jedoch deutlich die fortschrittlichen Fähigkeiten von Scribe.
In dieser Transkriptanalyse einer britischen Parlamentsanhörung sehen Sie, wie Scribe keine Fehler macht, Akzente und verschiedene Stimmfarben korrekt erfasst und Hintergrundgeräusche sowie Lachen richtig kennzeichnet.
Scribe von ElevenLabs (Erstellungszeit des Transkripts: 4,66 s)
Darf ich den ehrenwerten Herrn fragen, welche Maßnahmen ergriffen werden, um diesen Ort barrierefreier zu machen, insbesondere für einige unserer Kollegen mit Behinderung?Zustimmung. (Gemurmel im Publikum) Entschuldigung, das liegt wohl an meinem antipodischen Hintergrund. Könnte er die Frage bitte wiederholen? Ich habe sie nicht verstanden.(Publikum lacht) Wow. Oh, wow. Heute sehr beliebt. Ähm, ich- ich wollte sagen, dass- dass einige Parlamentskollegen mit Behinderung es ziemlich schwer haben, sich in bestimmten Bereichen des Gebäudes zu bewegen. Da wir gerade renovieren, was kann getan werden, damit Menschen mit Behinderung sich freier bewegen können und der Ort barrierefrei wird?Herr Paul. (Publikum lacht) Es tut mir wirklich leid. Könnte er es bitte ganz langsam auf Antipodisch-Englisch sagen? Danke. Geben Sie einfach irgendeine Antwort. Ich denke, die Antwort... Ich denke, die Antwort könnte helfen, wenn Sie schriftlich antworten wenn Sie lesen, Herr Präsident. Gut, Chris Elmore. (lacht) Danke, Herr Vizepräsident, ich versuche es gleich beim ersten Mal.(Gemurmel im Publikum) Oh nein. Sie sind Waliser. Kann ich- kann ich- kann ich- weil ich Waliser bin,, möge Gott ihm helfen.
OpenAI 4o (Erstellungszeit des Transkripts: 5,01 s)
Darf ich den ehrenwerten Herrn fragen, welche Maßnahmen ergriffen werden, um diesen Ort barrierefreier zu machen, insbesondere für einige unserer Kollegen mit Behinderung?Entschuldigung, das liegt wohl an meinem antipodischen Hintergrund. Könnte er die Frage bitte wiederholen? Ich habe sie nicht verstanden.Nun, heute sehr beliebt. Ich sehe, dass einige Parlamentskollegen mit Behinderung es ziemlich schwer haben, sich in bestimmten Bereichen des Gebäudes zu bewegen. Da wir gerade renovieren, was kann getan werden, damit Menschen mit Behinderung sich freier bewegen können und der Ort barrierefrei wird?Es tut mir wirklich leid. Könnten Sie es bitte ganz langsam auf Antipodisch-Englisch sagen?Ich denke, die Antwort könnte helfen, wenn Sie schriftlich antworten wenn Sie es lesen.Danke, Herr Vizepräsident. Ich versuche es gleich beim ersten Mal.Weil ich Waliser bin, möge Gott ihm helfen.
Mit jedem Fortschritt in der KI profitiert eine oft übersehene Gruppe besonders: Menschen, die stottern. Stottern ist eine genetische Sprachstörung, die etwa 1 % der Bevölkerung betrifft und automatische Spracherkennungssysteme (ASR) vor besondere Herausforderungen stellt. In einer Studie mit Testproben, bei denen in fast jedem vierten Wort gestottert wurde, erreichte Scribe eine durchschnittliche Genauigkeit von 98,7 %. Das zeigt erneut, dass Scribe die Branche anführt und ein Modell für alle Unternehmensanforderungen bietet.
Die Leistungsfähigkeit von Scribe zeigt sich besonders durch Funktionen, die gezielt auf die Anforderungen von Unternehmenskunden zugeschnitten sind.
Scribe jetzt testen, unser Web-Produkt ist bis zum 9. April kostenlos. Die Preise für Scribe sind sehr wettbewerbsfähig und beginnen für Unternehmenskunden ab 0,22 $/Stunde. Kontaktieren Sie gerne unser Vertriebsteam, wir richten gerne eine Demo ein und zeigen Ihnen, wie wir Ihr Unternehmen unterstützen können.

We’re introducing ElevenLabs Agent Skills, a collection of agent skills to enable you to build faster with ElevenLabs.
Transforming how we interact with technology