Einführung von Scribe v2

Heute stellen wir Scribe v2 vor: das genaueste Transkriptionsmodell, das je veröffentlicht wurde, mit Unterstützung für mehr als 90 Sprachen.

Introducing Scribe v2

Scribe v2 ist für die Batch-Transkription, Untertitelung und Beschriftung im großen Maßstab entwickelt. Es verbessert die Stabilität und Genauigkeit von Scribe v1 und bietet eine bessere Handhabung von langen Audiodateien, Pausen, Tonänderungen und längeren Stillephasen.

Introducing Scribe v2

Während Scribe v2 Realtime für ultra-niedrige Latenz und Agenten-Anwendungsfälle optimiert ist, ist Scribe v2 für lange und komplexe Aufnahmen optimiert und behält die Genauigkeit bei verschiedenen Sprechern, Akzenten und Vortragsstilen bei. Das Ergebnis sind durchweg zuverlässige Transkripte unter einer Vielzahl von realen Audio-Bedingungen.


Scribe v2 erreicht die niedrigste Wortfehlerrate, die in branchenüblichen Benchmarks verzeichnet wurde.

Scribe v2 FLEURS benchmark

Keyterm Prompting für kontextbewusste Transkription

Keyterm Prompting geht über das standardmäßige Custom Vocabulary hinaus, indem es den Kontext des Transkripts nutzt. Wählen Sie bis zu 100 Wörter oder Phrasen aus, und Scribe v2 entscheidet genau, wann diese Begriffe transkribiert werden sollen. Dies macht es besonders geeignet für technische Bereiche, Markennamen und branchenspezifische Sprache.

Scribe v2 keyterm prompting

Integrierte Entitätserkennung mit präzisen Zeitstempeln

Scribe v2 umfasst native Entitätserkennung für strukturierte Audioanalyse.

Sie können bis zu 56 Kategorien auswählen, darunter personenbezogene Daten, Gesundheitsdaten oder Zahlungsdetails. Scribe v2 erkennt diese Instanzen und ihre genauen Zeitstempel automatisch in Ihrem Transkript, was die Überprüfung, Schwärzung oder Verarbeitung sensibler Informationen im großen Maßstab erleichtert.

Erfahren Sie mehr in der API-Dokumentation: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Automatische mehrsprachige Transkription

Scribe v2 unterstützt intelligente mehrsprachige Workflows direkt ab Werk.

Sie können Audio senden, das mehrere Sprachen in einer einzigen Datei enthält. Das Modell erkennt jede Sprache automatisch und transkribiert sie korrekt, ohne manuelle Segmentierung oder Konfiguration.

Zusätzliche Funktionen für Produktions-Workflows

Scribe v2 umfasst eine Reihe von Funktionen, die für Unternehmens- und Entwickleranwendungsfälle entwickelt wurden:

  • Intelligente Sprecher-Diarisierung für klare, intuitive Sprecherkennzeichnung
  • Präzise wortgenaue Zeitstempel für genaue Untertitelausrichtung und interaktive Erlebnisse
  • Dynamische Audio-Tags, die Nicht-Sprachereignisse wie Lachen oder Schritte erkennen
  • Unternehmensbereitschaft mit SOC 2, ISO 27001, PCI DSS L1, HIPAA und DSGVO-Konformität, EU- und Indien-Datenresidenz und Unterstützung für Null-Retention-Modus

Scribe v2, jetzt im ElevenLabs Studio

Scribe v2 wird jetzt im ElevenLabs Studio für genauere Untertitel, Beschriftungen und Transkriptionen verwendet und unterstützt Teams, die große Bibliotheken von Audio- und Videodateien in den Bereichen Marketing, Medien, Forschung, Schulung und Compliance verwalten.

Scribe v2 in Studio

Jetzt ausprobieren: https://elevenlabs.io/app/studio

Mit der API entwickeln

Mit Scribe v2 können Entwickler und Unternehmen komplexe Audio-Pipelines automatisieren, die Genauigkeit in globalen Inhalts-Workflows verbessern und sicher mit vollständiger Compliance und Datenresidenzkontrollen skalieren.

Scribe v2 Keyterm prompting code snippet

Scribe v2 ist ab heute über unsere API und Creative-Plattform verfügbar.

Jetzt ausprobieren: https://elevenlabs.io/app/speech-to-text

Dokumentation lesen: https://elevenlabs.io/docs/capabilities/speech-to-text

Hier anmelden: https://elevenlabs.io/speech-to-text

Entdecken Sie Artikel des ElevenLabs-Teams

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden