Einführung von Scribe v2

Veröffentlicht: 9. Jan. 2026

AnhörenArtikel anhören

0:00

0:000:00

Scribe v2 ist für die Batch-Transkription, Untertitelung und Beschriftung im großen Maßstab entwickelt. Es verbessert die Stabilität und Genauigkeit von Scribe v1 und bietet eine bessere Handhabung von langen Audiodateien, Pausen, Tonänderungen und längeren Stillephasen.

Während Scribe v2 Realtime für extrem niedrige Latenz und

Scribe v2 erreicht die niedrigste Wortfehlerrate, die in branchenüblichen Benchmarks verzeichnet wurde.

Keyterm Prompting für kontextbewusste Transkription

Keyterm Prompting geht über das standardmäßige Custom Vocabulary hinaus, indem es den Kontext des Transkripts nutzt. Wählen Sie bis zu 100 Wörter oder Phrasen aus, und Scribe v2 entscheidet genau, wann diese Begriffe transkribiert werden sollen. Dies macht es besonders geeignet für technische Bereiche, Markennamen und branchenspezifische Sprache.

Integrierte Entitätserkennung mit präzisen Zeitstempeln

Scribe v2 umfasst native Entitätserkennung für strukturierte Audioanalyse.

Sie können bis zu 56 Kategorien auswählen, darunter personenbezogene Daten, Gesundheitsdaten oder Zahlungsdetails. Scribe v2 erkennt diese Instanzen und ihre genauen Zeitstempel automatisch in Ihrem Transkript, was die Überprüfung, Schwärzung oder Verarbeitung sensibler Informationen im großen Maßstab erleichtert.

Erfahren Sie mehr in der API-Dokumentation: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Automatische mehrsprachige Transkription

Scribe v2 unterstützt intelligente mehrsprachige Workflows direkt ab Werk.

Sie können Audio senden, das mehrere Sprachen in einer einzigen Datei enthält. Das Modell erkennt jede Sprache automatisch und transkribiert sie korrekt, ohne manuelle Segmentierung oder Konfiguration.

Zusätzliche Funktionen für Produktions-Workflows

Scribe v2 umfasst eine Reihe von Funktionen, die für Unternehmens- und Entwickleranwendungsfälle entwickelt wurden:

Intelligente Sprecher-Diarisierung für klare, intuitive Sprecherkennzeichnung
Präzise wortgenaue Zeitstempel für genaue Untertitelausrichtung und interaktive Erlebnisse
Dynamische Audio-Tags, die Nicht-Sprachereignisse wie Lachen oder Schritte erkennen
Unternehmensbereitschaft mit SOC 2, ISO 27001, PCI DSS L1, HIPAA und DSGVO-Konformität, EU- und Indien-Datenresidenz und Unterstützung für Null-Retention-Modus

Scribe v2, jetzt im ElevenLabs Studio

Scribe v2 wird jetzt im ElevenLabs Studio für genauere Untertitel, Beschriftungen und Transkriptionen verwendet und unterstützt Teams, die große Bibliotheken von Audio- und Videodateien in den Bereichen Marketing, Medien, Forschung, Schulung und Compliance verwalten.

Jetzt ausprobieren: https://elevenlabs.io/app/studio

Mit der API entwickeln

Mit Scribe v2 können Entwickler und Unternehmen komplexe Audio-Pipelines automatisieren, die Genauigkeit in globalen Inhalts-Workflows verbessern und sicher mit vollständiger Compliance und Datenresidenzkontrollen skalieren.