Direkt zum Inhalt

Scribe v2 Realtime vorgestellt

Veröffentlicht

AnhörenArtikel anhören

Scribe v2 Realtime: das präziseste Modell für Live-Transkriptionen

Scribe v2 Realtime

Scribe v2 Realtime setzt einen neuen Standard für niedrige Latenz bei Speech to Text.

Entwickelt für Live-Anwendungen – Voice Agents, Meeting-Assistenten und Echtzeit-Untertitelung – transkribiert es Sprache in unter 150 ms auf Englisch, Französisch, Deutsch, Italienisch, Spanisch, Portugiesisch und 90 weiteren Sprachen.

Scribe v2 Realtime benchmark

Scribe v2 Realtime ist speziell für agentische Anwendungsfälle entwickelt. Bei 500 schwierigen Beispielen mit Hintergrundgeräuschen und komplexen Inhalten übertrifft es alle anderen Modelle deutlich.

Wichtige Funktionen

  • Negative Latenz: Vorhersage von nächsten Wörtern und Satzzeichen
  • Automatische Spracherkennung: Sprechen Sie in jeder Sprache, wechseln Sie während des Gesprächs die Sprache
  • Text-Conditioning: Scribe v2 Realtime setzt die Transkription auf Basis des vorherigen Batches fort – nützlich beim Neustart einer Verbindung
  • Voice Activity Detection (VAD)
  • Manuelles Commit: Volle Kontrolle darüber, wann Transkriptionssegmente abgeschlossen werden
  • Mehrere Audioformate: Unterstützung für PCM (48kHz) und μ-law-Codierung
  • Enterprise-ready mit SOC 2-, ISO 27001-, PCI DSS L1-, HIPAA- und DSGVO-Konformität, Datenresidenz in der EU und Indien sowie Zero Retention-Modus für sensible Anwendungen

Scribe v2 Realtime ermöglicht menschliches Verständnis in Echtzeit und unterstützt natürliche Gespräche sowie sofortige Reaktionen in Live-Umgebungen. Scribe v2 Realtime erreicht 93,5 % Genauigkeit in 30 häufig genutzten europäischen und asiatischen Sprachen.

Mit der API entwickeln

Scribe v2 Realtime ist ab sofort über die ElevenLabs API verfügbar.

Dokumentation ansehen: https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

Scribe v2 Realtime in ElevenLabs Agents nutzen

Setzen Sie natürliche, menschlich klingende Agents mit Scribe v2 Realtime ein. Entwickeln Sie Sprachassistenten für Support, Vertrieb oder Produktanwendungen, die in Echtzeit verstehen und reagieren.

Mehr erfahren: https://elevenlabs.io/agents

Scribe v2 Realtime for Agents

Jetzt starten

Nutzen Sie Scribe v2 Realtime über unsere API oder direkt in ElevenLabs Agents.

Hier registrieren: https://elevenlabs.io/app/sign-up

Ähnliche Artikel

Erstellen Sie mit hochwertiger KI-Audio