Scribe Realtime v2 sätter en ny standard för live Speech to Text

Idag introducerar vi Scribe v2 Realtime, den mest exakta låg-latens Speech to Text-modellen, som levererar live-transkribering på under 150 ms.

Scribe v2 Realtime

Det snabbaste och mest exakta realtids-transkriptionssystemet

Scribe v2 Realtime sätter en ny standard för låg latens

Designad för live-användning—

Scribe v2 Realtime benchmark

Utvecklare kan strömma ljud direkt till API:et eller komma åt det via ElevenLabs Agents för snabb integration i röst- och agentarbetsflöden.

[Infoga videodemonstration: visa transkriptionslatens och noggrannhet]

  • Negativ latens: Nästa ord och skiljetecken förutsägelse
  • Automatisk språkdetection: Tala på vilket språk som helst, byt språk mitt i samtalet
  • Textkonditionering: Scribe v2 Realtime fortsätter transkriberingen baserat på den tidigare batchen, användbart vid omstart av en anslutning
  • Röstaktivitetsdetektion (VAD)
  • Manuell bekräftelse: Full kontroll över när transkriptsegment ska slutföras
  • Flera ljudformat: Stöd för PCM (48kHz) och μ-law-kodning
  • Företagsklarmed SOC 2, ISO 27001, PCI DSS L1, HIPAA och GDPR-efterlevnad, EU och Indien dataresidensalternativ och Zero retention-läge för känsliga arbetsbelastningar

Låg latens

Transkriberar på under <XX ms från tal till text.

Hög noggrannhet

Överträffar alla större strömmande ASR-system och sätter nya standarder för realtids-prestanda. Byggd på en helt ny arkitektur, utökar den precisionen som först introducerades med Scribe v1.https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

Skalbart flerspråkigt stöd

Scribe Realtime v2 stöder 92 språk, inklusive regionala dialekter, vilket ökar tillgängligheten för globala applikationer.

Utvecklarfunktionerhttps://elevenlabs.io/agents

Scribe v2 Realtime for Agents

[Infoga funktionsöversikt eller arkitekturdiagram]

Integration och tillgänglighet

Scribe Realtime v2 är tillgänglig idag via ElevenLabs API och i ElevenLabs Agents. Utvecklare kan börja strömma live-ljud och få transkriptioner i realtid med en enkel WebSocket-anslutning.https://elevenlabs.io/app/sign-up

Utforska artiklar av ElevenLabs-teamet

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in