Scribe Realtime v2 wyznacza nowy standard dla live Speech to Text

Today we’re introducing Scribe v2 Realtime, the most accurate low-latency Speech to Text model, delivering live transcription in under 150 ms.

Scribe v2 Realtime

Najszybszy i najdokładniejszy system transkrypcji w czasie rzeczywistym

Stworzony do zasilania systemów konwersacyjnych, gdzie każda milisekunda ma znaczenie, Scribe Realtime v2 łączy szybkość, dokładność i wielojęzyczne wsparcie, umożliwiając nową generację doświadczeń opartych na mowie.

Stworzony do mowy na żywo

Scribe v2 Realtime benchmark

Deweloperzy mogą przesyłać audio bezpośrednio do API lub uzyskać do niego dostęp przez ElevenLabs Agents, aby szybko zintegrować je z przepływami głosowymi i agentami.

[Wstaw demo wideo: pokaż opóźnienie i dokładność transkrypcji]

  • Negative latency: Next word and punctuation prediction
  • Automatic language detection: Speak in any language, switch language mid conversation
  • Text conditioning: Scribe v2 Realtime continues the transcription based on the previous batch, useful when restarting a connection
  • Voice Activity Detection (VAD)
  • Manual commit: Full control over when to finalize transcript segments
  • Multiple audio formats: Support for PCM (48kHz) and  μ-law encoding
  • Enterprise ready with SOC 2, ISO 27001, PCI DSS L1, HIPAA, and GDPR compliance, EU and India data residency options and Zero retention mode for sensitive workloads

Niskie opóźnienie

Transkrybuje w czasie poniżej <XX ms z mowy na tekst.

Wysoka dokładność

Przewyższa wszystkie główne systemy ASR, ustanawiając nowe standardy wydajności w czasie rzeczywistym. Zbudowany na całkowicie nowej architekturze, rozszerza precyzję wprowadzoną w Scribe v1.https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

Skalowalne wsparcie wielojęzyczne

Scribe Realtime v2 obsługuje 92 języki, w tym dialekty regionalne, zwiększając dostępność dla globalnych aplikacji.

Funkcje dla deweloperówhttps://elevenlabs.io/agents

Scribe v2 Realtime for Agents

[Wstaw siatkę funkcji lub diagram architektury]

Integracja i dostępność

Scribe Realtime v2 jest dostępny już dziś przez API ElevenLabs i w ElevenLabs Agents. Deweloperzy mogą zacząć przesyłać audio na żywo i otrzymywać transkrypcje w czasie rzeczywistym, używając prostego połączenia WebSocket.https://elevenlabs.io/app/sign-up

Przeglądaj artykuły zespołu ElevenLabs

ElevenLabs

Twórz z najwyższą jakością dźwięku AI