Scribe Realtime v2 établit un nouveau standard pour le Speech to Text en direct

Today we’re introducing Scribe v2 Realtime, the most accurate low-latency Speech to Text model, delivering live transcription in under 150 ms.

Scribe v2 Realtime

Le système de transcription en temps réel le plus rapide et précis

Conçu pour alimenter les systèmes conversationnels où chaque milliseconde compte, Scribe Realtime v2 combine vitesse, précision et couverture multilingue pour permettre la prochaine génération d'expériences vocales en direct.

Conçu pour la parole en direct

Scribe v2 Realtime benchmark

Les développeurs peuvent diffuser de l'audio directement vers l'API ou y accéder via ElevenLabs Agents pour une intégration rapide dans les workflows vocaux et d'agents.

[Insérer démo vidéo : montrer la latence et la précision de la transcription]

  • Negative latency: Next word and punctuation prediction
  • Automatic language detection: Speak in any language, switch language mid conversation
  • Text conditioning: Scribe v2 Realtime continues the transcription based on the previous batch, useful when restarting a connection
  • Voice Activity Detection (VAD)
  • Manual commit: Full control over when to finalize transcript segments
  • Multiple audio formats: Support for PCM (48kHz) and  μ-law encoding
  • Enterprise ready with SOC 2, ISO 27001, PCI DSS L1, HIPAA, and GDPR compliance, EU and India data residency options and Zero retention mode for sensitive workloads

Faible latence

Transcrit en moins de <XX ms de la parole au texte.

Haute précision

Surpasse tous les principaux systèmes ASR en streaming, établissant de nouveaux standards pour la performance en temps réel. Construit sur une architecture entièrement nouvelle, il étend la précision introduite avec Scribe v1.https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

Support multilingue évolutif

Scribe Realtime v2 prend en charge 92 langues, y compris les dialectes régionaux, élargissant l'accessibilité pour les applications mondiales.

Fonctionnalités pour développeurshttps://elevenlabs.io/agents

Scribe v2 Realtime for Agents

[Insérer grille de fonctionnalités ou schéma d'architecture]

Intégration et disponibilité

Scribe Realtime v2 est disponible dès aujourd'hui via l'API ElevenLabs et dans ElevenLabs Agents. Les développeurs peuvent commencer à diffuser de l'audio en direct et recevoir des transcriptions en temps réel en utilisant une simple connexion WebSocket.https://elevenlabs.io/app/sign-up

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter