
Scribe v2 właśnie dostał aktualizację
- Kategoria
- Deweloper
- Data
Najdokładniejsze STT do dużych projektów. Wykrywa akcenty i efekty dźwiękowe, pozwala kierować transkrypcją za pomocą słów kluczowych.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Twórz napisy, transkrypcje do podcastów, wideo, wywiadów i innych nagrań – wszystko z najwyższą dokładnością przez API.
Scribe v2 zapewnia najwyższą dokładność transkrypcji, dając czysty, edytowalny tekst nawet w trudnych warunkach audio i przy różnych akcentach.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Transkrypcja działa nawet w hałasie, z muzyką w tle, silnym akcentem czy słabej jakości dźwiękiem.
Transcription API od ElevenLabs wykrywa śmiech, emocje i efekty dźwiękowe. Użyj podpowiedzi z kluczowymi terminami, by lepiej rozpoznać branżowe słownictwo.
.webp&w=3840&q=95)
.webp&w=3840&q=95)

Wychwytuj zdarzenia bez mowy, jak śmiech, oklaski, muzyka czy szumy w tle. Transkrypcje pokazują pełny kontekst nagrania, nie tylko słowa.
Automatycznie rozpoznaj i oznacz do 48 mówców. Jasne przypisanie, kto co powiedział, w czytelnych transkrypcjach.
Automatycznie wykrywaj i oznaczaj 56 typów encji, w tym imiona, daty, miejsca i organizacje w twoich transkrypcjach.

Najwyższa dokładność, idealny do pracy z dużymi plikami.

Najniższe opóźnienie, do pracy na żywo.
Wyjątkowa dokładność niezależnie od akcentu, dialektu czy jakości nagrania.
Zmień languageCode, żeby sprawdzić inne języki
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // Ustaw język
diarize: true
});
console.log(transcription);“Od dubbingu Reels w lokalnych językach po generowanie muzyki i głosów postaci w Horizon – ElevenLabs pozwala twórcom, firmom i organizacjom działać globalnie z głosem, muzyką i dźwiękiem na dużą skalę.”
“Bezkonkurencyjna dokładność Scribe w tylu językach pozwala Fieldy rozumieć każdą rozmowę i łatwo rozwijać się na nowe rynki. Po przejściu na ElevenLabs Scribe Fieldy zwiększył retencję użytkowników o 50%.”
“Dzięki ElevenLabs szybko dodaliśmy zaawansowaną zamianę tekstu na mowę do naszego SDK. Agenci mogą odpowiadać w czasie rzeczywistym wyrazistym głosem na pytania użytkowników lub reagować na to, co widzą.”

“Twilio zintegrowało technologię generowania głosu AI od ElevenLabs z CPaaS, ulepszając ConversationRelay. Dzięki temu firmy i deweloperzy mogą tworzyć rozmowy głosowe AI, które brzmią naturalnie, są wyraziste i reagują w czasie rzeczywistym bezpośrednio z platformy Twilio CPaaS. Cieszymy się, że Twilio wybrało ElevenLabs, by ConversationRelay miało najbardziej naturalne, ludzkie głosy.”









