Scribe Realtime v2 sätter en ny standard för live Speech to Text

Today we’re introducing Scribe v2 Realtime, the most accurate low-latency Speech to Text model, delivering live transcription in under 150 ms.

Scribe v2 Realtime

Det snabbaste och mest exakta realtids-transkriptionssystemet

Byggd för att driva konversationssystem där varje millisekund räknas, kombinerar Scribe Realtime v2 hastighet, noggrannhet och flerspråkig täckning för att möjliggöra nästa generation av live, röstfokuserade upplevelser.

Byggd för live-tal

Scribe v2 Realtime benchmark

Utvecklare kan strömma ljud direkt till API:et eller komma åt det via ElevenLabs Agents för snabb integration i röst- och agentarbetsflöden.

[Infoga videodemonstration: visa transkriptionslatens och noggrannhet]

  • Negative latency: Next word and punctuation prediction
  • Automatic language detection: Speak in any language, switch language mid conversation
  • Text conditioning: Scribe v2 Realtime continues the transcription based on the previous batch, useful when restarting a connection
  • Voice Activity Detection (VAD)
  • Manual commit: Full control over when to finalize transcript segments
  • Multiple audio formats: Support for PCM (48kHz) and  μ-law encoding
  • Enterprise ready with SOC 2, ISO 27001, PCI DSS L1, HIPAA, and GDPR compliance, EU and India data residency options and Zero retention mode for sensitive workloads

Låg latens

Transkriberar på under <XX ms från tal till text.

Hög noggrannhet

Överträffar alla större strömmande ASR-system och sätter nya standarder för realtids-prestanda. Byggd på en helt ny arkitektur, utökar den precisionen som först introducerades med Scribe v1.https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

Skalbart flerspråkigt stöd

Scribe Realtime v2 stöder 92 språk, inklusive regionala dialekter, vilket ökar tillgängligheten för globala applikationer.

Utvecklarfunktionerhttps://elevenlabs.io/agents

Scribe v2 Realtime for Agents

[Infoga funktionsöversikt eller arkitekturdiagram]

Integration och tillgänglighet

Scribe Realtime v2 är tillgänglig idag via ElevenLabs API och i ElevenLabs Agents. Utvecklare kan börja strömma live-ljud och få transkriptioner i realtid med en enkel WebSocket-anslutning.https://elevenlabs.io/app/sign-up

Utforska artiklar av ElevenLabs-teamet

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in