
Transkrybuj mowę na żywo z ElevenLabs API
API zamiany mowy na tekst na żywo
Transkrybuj mowę na żywo z Scribe v2 Realtime
Scribe v2 Realtime to najdokładniejszy model transkrypcji na żywo z opóźnieniem 150 ms w ponad 90 językach. Dostępny przez API.
- Lovable
- Veed model
- Synthesia
- Stripe
- Perplexity
- Twilio
Stworzone dla szybkości i precyzji
Ekspresowe, bardzo dokładne i stworzone do mowy na żywo. Scribe v2 Realtime daje natychmiastową transkrypcję do zastosowań na żywo.
Najdokładniejsza transkrypcja na żywo
Scribe v2 Realtime osiąga najlepszą na rynku dokładność transkrypcji przy opóźnieniu ~150 ms, nawet w trudnych warunkach audio i przy różnych akcentach.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Stworzone na każdą sytuację
Transkrypcja działa nawet w hałasie, z muzyką w tle, silnym akcentem czy słabej jakości dźwiękiem.
Rozpoznawanie mowy zoptymalizowane pod kątem działania na żywo
Bazując na Scribe v1, Scribe v2 Realtime zapewnia opóźnienie ~150 ms i świetną dokładność niezależnie od akcentu, tonu czy otoczenia.

Stworzone dla Agents i aplikacji głosowych
Scribe v2 Realtime powstał z myślą o deweloperach tworzących agentów konwersacyjnych, asystentów spotkań i aplikacje głosowe, gdzie liczy się szybkość i precyzja.
Predykcyjna transkrypcja dla niskiego opóźnienia
Scribe v2 Realtime przewiduje najbardziej prawdopodobne kolejne słowa i znaki interpunkcyjne – dzięki temu transkrypcja na żywo jest jeszcze dokładniejsza.
Wykrywanie aktywności głosu
Wykrywa, kiedy mowa się zaczyna i kończy, precyzyjnie dzieląc audio dla płynnej transkrypcji na żywo.
Ręczna kontrola zatwierdzania
Deweloperzy sami decydują, kiedy zatwierdzić transkrypcję – idealne do własnych streamów i precyzyjnej kontroli.
Wiele formatów audio
Obsługuje PCM (8–48 kHz) i kodowanie μ-law, dzięki czemu działa z telefonią, przeglądarką i w studiu.
Modele dopasowane do każdego zastosowania
Scribe v2 do masowych zastosowań i Scribe v2 Realtime do pracy na żywo z niskimi opóźnieniami

Scribe v2
Najwyższa dokładność, stworzony do pracy wsadowej.
- Dokładność >95%
- 90+ języków
- Wykrywanie zdarzeń niebędących mową
- Wykrywanie encji
- Podpowiedzi słów kluczowych

Scribe v2 w czasie rzeczywistym
Najniższe opóźnienie, do pracy na żywo.
- Opóźnienie poniżej 150 ms
- 90+ języków
- Transkrypcja na żywo
- Wykrywanie aktywności głosu
- Automatyczne rozpoznawanie języka
Transkrybuj mowę w 90+ językach i różnych akcentach
Świetna dokładność niezależnie od akcentu, dialektu czy warunków nagrania.
Zmień languageCode, żeby zobaczyć inne języki
import { useScribe } from "@elevenlabs/react";
const scribe = useScribe({
modelId: "scribe_v2_realtime",
languageCode: , // Ustaw język
onSessionStarted: () =>
console.log("Session started"),
onPartialTranscript: (data) =>
console.log("Partial:", data.text)
});Z ElevenLabs korzystają największe firmy i marki
“Od dubbingu Reels w lokalnych językach, po generowanie muzyki i głosów postaci w Horizon – ElevenLabs pozwala twórcom, firmom i organizacjom działać globalnie z głosem, muzyką i dźwiękiem.”
“Niezrównana dokładność Scribe w tylu językach pozwala Fieldy rozumieć każdą rozmowę i łatwo rozwijać się na nowych rynkach. Po przejściu na ElevenLabs Scribe Fieldy zwiększyło retencję użytkowników o 50%.”
“Dzięki ElevenLabs szybko dodaliśmy zaawansowaną zamianę tekstu na mowę do naszego SDK. Agenci mogą odpowiadać na pytania użytkowników lub reagować na to, co widzą, głosem w czasie rzeczywistym.”

“Twilio zintegrowało technologię generowania głosu AI od ElevenLabs z CPaaS, ulepszając ConversationRelay. Dzięki temu firmy i deweloperzy mogą tworzyć rozmowy głosowe AI, które brzmią naturalnie, są pełne emocji i reagują na żywo prosto z platformy Twilio CPaaS. Cieszymy się, że Twilio wybrało ElevenLabs, by ConversationRelay miało najbardziej naturalne i ekspresyjne głosy.”
API gotowe do wdrożenia

Elastyczne ceny dopasowane do twoich potrzeb
Doświadcz najlepszej dokładności i szybkości – ceny dopasowane do startupów i dużych zespołów.
Od $0,28 za godzinę
w rocznych planach Business

Najczęściej zadawane pytania
Najnowsze aktualizacje

.webp&w=3840&q=80)
Porozmawiaj z posągiem: jak stworzyć wielomodalną aplikację z ElevenAgents




ElevenLabs OSS Engineers Fund: wsparcie dla projektów open-source, które kształtują naszą pracę
.webp&w=3840&q=80)
Dodaj agenta głosowego Świętego Mikołaja do swojej aplikacji React w kilka minut

Przedstawiamy ElevenLabs UI: otwarte komponenty audio i agentów na web
.webp&w=3840&q=80)
ElevenLabs Agents vs OpenAI Realtime API: Pojedynek Agentów Konwersacyjnych