Treffen Sie Scribe

Verfasst von: Tim von Känel; Flavio Schneider
Veröffentlicht: 26. Feb. 2025

AnhörenArtikel anhören

0:00

0:000:00

Schreiber, unser erster [Speech to Text] Das Modell ist das genaueste Transkriptionsmodell der Welt. Entwickelt, um mit der Unvorhersehbarkeit von Audio in der realen Welt umzugehen, transkribiert Scribe Sprache in 99 Sprachen und bietet Zeitstempel auf Wortebene, Sprecherdiarisierung und Audioereignis-Tagging – alles in einer strukturierten Antwort für eine nahtlose Integration.

Scribe ist für Präzision konzipiert. In den FLEURS- und Common Voice-Benchmark-Tests in 99 Sprachen übertrifft es konsequent führende Modelle wie Gemini 2.0 Flash, Whisper Large V3 und Deepgram Nova-3. Ob es sich um Besprechungszusammenfassungen, Filmuntertitel oder sogar Songtexte handelt, Scribe bietet die niedrigste automatisierte Transkriptionsfehlerquote in Italienisch (98,7 %), Englisch (96,7 %) und 97 anderen Sprachen.

Scribe macht ASR universell zugänglich – die Fehlerquote in traditionell unterversorgten Sprachen wie Serbisch, Kantonesisch und Malayalam drastisch senkend, wo konkurrierende Modelle oft über 40 % Wortfehlerquoten liegen.

The world's most accurate ASR model by IIElevenLabs.

Entwickler können Scribe heute über unsere Sprache-zu-Text-API strukturierte JSON-Transkripte mit Sprecherdiarisierung und Wortzeitstempeln sowie Nicht-Sprechereignismarkierungen (z. B. Lachen) zu erhalten. Eine latenzarme Version für Echtzeitanwendungen wird bald veröffentlicht.

Schöpfer und Unternehmen können Scribe direkt über die ElevenLabs-Dashboard Audio- oder Videodateien hochzuladen und formatierte Transkripte zu erstellen.

Beginnen Sie mit Scribe:

API-Dokumentation $ Versuchen Sie es im ElevenLabs-Dashboard