Scribe v2 Realtime jetzt live in ElevenLabs Agents

Verfasst von: Lauren Rothwell
Veröffentlicht: 13. Nov. 2025

AnhörenArtikel anhören

0:00

0:000:00

Extrem niedrige Latenz

Diese Woche haben wir

Scribe v2 Realtime transcribes speech in under 150ms with state-of-the-art accuracy, enabling agents to respond as naturally as humans do in conversation.

Entwickelt für reale Gespräche

Die meisten

Scribe v2 Realtime wurde genau für diese Herausforderungen trainiert.

In internen Benchmarks mit Hunderten von herausfordernden englischen Gesprächsproben mit schlechter Audioqualität, unterschiedlichen Akzenten und Füllwörtern erfasste Scribe v2 Realtime die Benutzerabsicht genauer als jedes konkurrierende Echtzeit-ASR-Modell.

Unten sind ein paar reale Beispiele, bei denen wir die Transkriptionsgenauigkeit von Scribe v2 Realtime in verschiedenen Umgebungen getestet haben.

00:00 / 00:00

Führende mehrsprachige Genauigkeit

Als globales Unternehmen mit einem großen Anteil an Agenten, die in Spanisch, Portugiesisch, Hindi und vielen anderen Sprachen eingesetzt werden, war es entscheidend, dass Scribe v2 Realtime in allen Regionen eine erstklassige Leistung beibehält.

Beim FLEURS-Mehrsprachen-Benchmark, der die Genauigkeit in 30 Sprachen misst, erreichte Scribe v2 Realtime die niedrigste Wortfehlerrate (WER) aller ASR-Modelle mit niedriger Latenz.

Dies ermöglicht es Unternehmen, mehrsprachige Agenten einzusetzen, die sofort und genau reagieren, ohne Kompromisse bei Geschwindigkeit oder Präzision einzugehen.