
Scribe v2 har precis fått en uppgradering
- Kategori
- Utvecklare
- Datum
Scribe v2 Realtime är den mest träffsäkra realtids-STT:n med 150 ms fördröjning och stöd för över 90 språk. Finns via API.
Blixtsnabb, extremt noggrann och byggd för live-tal. Scribe v2 Realtime ger omedelbar transkribering för realtidsbehov.
Scribe v2 Realtime når branschledande transkriberingsnoggrannhet med ~150 ms latens, även i utmanande ljudmiljöer eller med olika dialekter.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Transkribering som fungerar även i bullriga miljöer, med bakgrundsmusik, starka dialekter och låg ljudkvalitet.
Bygger vidare på Scribe v1 – Scribe v2 Realtime levererar ~150 ms latens med banbrytande noggrannhet oavsett dialekt, tonläge och miljö.

Scribe v2 Realtime är utvecklad för utvecklare som bygger konversationsagenter, mötesassistenter och röstapplikationer där snabbhet och noggrannhet är avgörande.
Scribe v2 Realtime använder prediktiv transkribering för att förutse de mest sannolika orden och skiljetecknen – vilket ger exakt transkribering i realtid.
Upptäcker när tal börjar och slutar, och delar upp ljudet exakt för smidig och effektiv transkribering i realtid.
Ger utvecklare kontroll över när transkriberingar ska slutföras – perfekt för anpassad streaming och finjusterad noggrannhet.
Stöder PCM (8–48 kHz) och μ-law-kodning för kompatibilitet med telefoni, webbläsare och studio.
Scribe v2 för stora volymer och Scribe v2 Realtime för användning med låg fördröjning

Högsta noggrannhet, anpassad för batch-arbeten.

Lägst fördröjning, för realtidsanvändning.
Ger högsta noggrannhet oavsett dialekt, accent och inspelningsmiljö.
Ändra languageCode för att förhandsgranska språk
import { useScribe } from "@elevenlabs/react";
const scribe = useScribe({
modelId: "scribe_v2_realtime",
languageCode: , // Välj språk
onSessionStarted: () =>
console.log("Session started"),
onPartialTranscript: (data) =>
console.log("Partial:", data.text)
});“Från att dubba Reels på lokala språk till att skapa musik och karaktärsröster i Horizon – ElevenLabs gör det möjligt för kreatörer, företag och organisationer världen över att arbeta med röst, musik och ljud i stor skala.”
“Scribes oslagbara noggrannhet på så många språk gör att Fieldy förstår varje samtal och enkelt kan växa globalt. Fieldy har ökat användarretentionen med 50 % efter att ha bytt till ElevenLabs Scribe.”
“ElevenLabs gjorde det enkelt för oss att snabbt lägga till kraftfull text-till-tal-funktion i vårt SDK, så att agenter kan svara direkt med uttrycksfulla röster på användarfrågor eller ge feedback på vad de ser.”

“Twilio har integrerat ElevenLabs generativa AI-röstteknik i sin CPaaS och förbättrat ConversationRelay. Det gör att företag och utvecklare kan skapa samtalsbaserade AI-röstinteraktioner som låter mänskliga, känns uttrycksfulla och svarar direkt – direkt från Twilios CPaaS-plattform. Vi på ElevenLabs är glada att Twilio valt oss för att göra ConversationRelay ännu mer uttrycksfullt och mänskligt.”

Upplev marknadsledande noggrannhet och snabbhet med priser som passar allt från startups till stora företag.
$0,28 per timme och lägre
med årliga Business-abonnemang









