
Transkrybuj mowę z ElevenLabs API
Speech to Text API
Transkrybuj mowę z ElevenLabs Scribe v2
Najdokładniejsza zamiana mowy na tekst do masowych zastosowań. Wykrywaj akcenty i efekty dźwiękowe, kieruj transkrypcją za pomocą podpowiedzi słów kluczowych.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
- Lovable
- Veed model
- Synthesia
- Stripe
- Perplexity
- Twilio
Najdokładniejsze Speech to Text API do dużych zadań
Twórz napisy, transkrypcje do podcastów, wideo, wywiadów i innych nagrań – wszystko z najwyższą dokładnością przez API.
Bezkonkurencyjna dokładność transkrypcji
Scribe v2 zapewnia najwyższą dokładność transkrypcji, dając czysty, edytowalny tekst nawet w trudnych warunkach audio i przy różnych akcentach.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Stworzone na każdą sytuację
Transkrypcja działa nawet w hałasie, z muzyką w tle, silnym akcentem czy słabej jakości dźwiękiem.
Precyzyjna kontrola nad czasem, mówcami i zdarzeniami bez mowy.
Transcription API od ElevenLabs wykrywa śmiech, emocje i efekty dźwiękowe. Użyj podpowiedzi z kluczowymi terminami, by lepiej rozpoznać branżowe słownictwo.
Transkrybuj audio i wideo
.webp&w=3840&q=95)
Czyste, edytowalne transkrypcje
.webp&w=3840&q=95)
Podpowiedzi z kluczowymi terminami

Dynamiczne tagowanie dźwięku
Wychwytuj zdarzenia bez mowy, jak śmiech, oklaski, muzyka czy szumy w tle. Transkrypcje pokazują pełny kontekst nagrania, nie tylko słowa.
Inteligentne rozpoznawanie mówców
Automatycznie rozpoznaj i oznacz do 48 mówców. Jasne przypisanie, kto co powiedział, w czytelnych transkrypcjach.
Wykrywanie encji
Automatycznie wykrywaj i oznaczaj 56 typów encji, w tym imiona, daty, miejsca i organizacje w twoich transkrypcjach.

Scribe v2
Najwyższa dokładność, idealny do pracy z dużymi plikami.
- >95% dokładności
- 90+ języków
- Wykrywanie zdarzeń bez mowy
- Wykrywanie encji
- Podpowiedzi z kluczowymi terminami

Scribe v2 Realtime
Najniższe opóźnienie, do pracy na żywo.
- Opóźnienie poniżej 150 ms
- 90+ języków
- Transkrypcja na żywo
- Wykrywanie aktywności głosu
- Automatyczne rozpoznawanie języka
Transkrybuj mowę w ponad 90 językach i różnych akcentach
Wyjątkowa dokładność niezależnie od akcentu, dialektu czy jakości nagrania.
Zmień languageCode, żeby sprawdzić inne języki
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // Ustaw język
diarize: true
});
console.log(transcription);Zasilamy największe firmy i marki na świecie
“Od dubbingu Reels w lokalnych językach po generowanie muzyki i głosów postaci w Horizon – ElevenLabs pozwala twórcom, firmom i organizacjom działać globalnie z głosem, muzyką i dźwiękiem na dużą skalę.”
“Bezkonkurencyjna dokładność Scribe w tylu językach pozwala Fieldy rozumieć każdą rozmowę i łatwo rozwijać się na nowe rynki. Po przejściu na ElevenLabs Scribe Fieldy zwiększył retencję użytkowników o 50%.”
“Dzięki ElevenLabs szybko dodaliśmy zaawansowaną zamianę tekstu na mowę do naszego SDK. Agenci mogą odpowiadać w czasie rzeczywistym wyrazistym głosem na pytania użytkowników lub reagować na to, co widzą.”

“Twilio zintegrowało technologię generowania głosu AI od ElevenLabs z CPaaS, ulepszając ConversationRelay. Dzięki temu firmy i deweloperzy mogą tworzyć rozmowy głosowe AI, które brzmią naturalnie, są wyraziste i reagują w czasie rzeczywistym bezpośrednio z platformy Twilio CPaaS. Cieszymy się, że Twilio wybrało ElevenLabs, by ConversationRelay miało najbardziej naturalne, ludzkie głosy.”
API gotowe do produkcji

Najczęściej zadawane pytania
Najnowsze aktualizacje

.webp&w=3840&q=80)
Porozmawiaj z posągiem: jak stworzyć wielomodalną aplikację z ElevenAgents




ElevenLabs OSS Engineers Fund: wsparcie dla projektów open-source, które kształtują naszą pracę
.webp&w=3840&q=80)
Dodaj agenta głosowego Świętego Mikołaja do swojej aplikacji React w kilka minut

Przedstawiamy ElevenLabs UI: otwarte komponenty audio i agentów na web
.webp&w=3840&q=80)
ElevenLabs Agents vs OpenAI Realtime API: Pojedynek Agentów Konwersacyjnych