Przedstawiamy Scribe v2 Realtime

Opublikowano: 11 lis 2025

PosłuchajPosłuchaj tego artykułu

0:00

0:000:00

Skontaktuj się z nami

Dowiedz się więcej

Scribe v2 Realtime: najdokładniejszy model do transkrypcji na żywo

Scribe v2 Realtime wyznacza nowy standard niskiego opóźnienia w Speech to Text.

Stworzony do pracy na żywo — voice agents, asystentów spotkań i napisów na żywo — transkrybuje mowę w mniej niż 150 ms po angielsku, francusku, niemiecku, włosku, hiszpańsku, portugalsku i w 90 innych językach.

Scribe v2 Realtime został stworzony specjalnie do zastosowań agentowych. Na 500 trudnych próbkach z szumem tła i złożonymi informacjami wypada znacznie lepiej niż inne modele.

Najważniejsze cechy

Ujemne opóźnienie: przewidywanie kolejnych słów i znaków interpunkcyjnych
Automatyczne wykrywanie języka: mów w dowolnym języku, możesz zmieniać język w trakcie rozmowy
Text conditioning: Scribe v2 Realtime kontynuuje transkrypcję na podstawie poprzedniej partii, przydatne przy ponownym połączeniu
Voice Activity Detection (VAD)
Ręczne zatwierdzanie: pełna kontrola nad tym, kiedy zatwierdzić fragment transkrypcji
Wiele formatów audio: obsługa PCM (48kHz) i kodowania μ-law
Gotowy dla firm zgodność z SOC 2, ISO 27001, PCI DSS L1, HIPAA i RODO, możliwość przechowywania danych w UE i Indiach oraz tryb zerowej retencji dla wrażliwych danych

Scribe v2 Realtime zapewnia zrozumienie na poziomie człowieka w czasie rzeczywistym, umożliwiając naturalną rozmowę i natychmiastową reakcję na żywo. Scribe v2 Realtime osiąga 93,5% dokładności w 30 najczęściej używanych językach Europy i Azji.

Buduj z API

Scribe v2 Realtime jest już dostępny przez API ElevenLabs.

Zobacz dokumentację: https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Użyj Scribe v2 Realtime w ElevenLabs Agents

Twórz naturalnie brzmiących agentów z Scribe v2 Realtime. Buduj asystentów głosowych do wsparcia, sprzedaży lub obsługi w produkcie, którzy rozumieją i odpowiadają w czasie rzeczywistym.

Dowiedz się więcej: https://elevenlabs.io/agents