
Transkribera tal med ElevenLabs API
Speech to Text API
Transkribera tal med ElevenLabs Scribe v2
Marknadens mest träffsäkra Speech to Text för stora volymer. Upptäck betoning och ljudeffekter, och styr transkriberingen med nyckelord.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
- Lovable
- Veed model
- Synthesia
- Stripe
- Perplexity
- Twilio
Mest träffsäkra Speech to Text API för batchjobb
Skapa undertexter, textremsor och redigerbara transkriptioner för poddar, videor, intervjuer och annat inspelat material – allt med branschledande noggrannhet via API.
Oöverträffad transkriptionsnoggrannhet
Scribe v2 ger branschledande transkriptionsnoggrannhet och levererar ren, redigerbar text även vid svåra ljudförhållanden eller olika dialekter.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Utformad för alla situationer
Transkribering som fungerar även i bullriga miljöer, med bakgrundsmusik, starka dialekter och låg ljudkvalitet.
Detaljerad kontroll över timing, talare och icke-talshändelser.
ElevenLabs Transcription API kan upptäcka skratt, känslor och ljudeffekter. Använd nyckelord för att styra transkriberingen med branschspecifika termer.
Transkribera ljud och video
.webp&w=3840&q=95)
Rena, redigerbara transkriptioner
.webp&w=3840&q=95)
Nyckelordspromptning

Dynamisk ljudtaggning
Fånga upp icke-talshändelser som skratt, applåder, musik och bakgrundsljud. Transkriptionerna innehåller hela ljudets kontext, inte bara orden.
Smart talaridentifiering
Identifiera och märk automatiskt upp till 48 talare. Tydlig uppdelning av vem som säger vad, organiserat i lättlästa transkriptioner.
Enhetsigenkänning
Identifiera och tagga automatiskt 56 olika enhetstyper, som namn, datum, platser och organisationer i dina transkriptioner.

Scribe v2
Högsta noggrannhet, anpassad för batchjobb.
- >95% Noggrannhet
- 90+ Språk
- Icke-talshändelser
- Enhetsigenkänning
- Nyckelordspromptning

Scribe v2 i realtid
Lägst fördröjning, för realtidsjobb.
- Under 150 ms fördröjning
- 90+ Språk
- Transkriptionsströmning
- Röstaktivitetsdetektion
- Automatisk språkkänning
Transkribera tal på över 90 språk och många olika dialekter
Ger högsta noggrannhet oavsett dialekt, accent eller inspelningskvalitet.
Ändra languageCode för att förhandsgranska språk
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // Välj språk
diarize: true
});
console.log(transcription);Används av världsledande företag och varumärken
“Från att dubba Reels på lokala språk till att skapa musik och karaktärsröster i Horizon – ElevenLabs plattform gör det möjligt för kreatörer, företag och organisationer världen över att arbeta med röst, musik och ljud i stor skala.”
“Scribes oslagbara noggrannhet på så många språk gör att Fieldy kan förstå varje samtal och enkelt växa över hela världen. Fieldy har ökat användarretentionen med 50% efter att ha gått över till ElevenLabs Scribe.”
“ElevenLabs gjorde det enkelt för oss att snabbt lägga till kraftfull Text to Speech i vårt SDK, så att agenter kan svara i realtid med uttrycksfulla röster på användarfrågor eller ge feedback på vad de ser.”

“Twilio har integrerat ElevenLabs generativa AI-röstteknik i sin CPaaS och förbättrat ConversationRelay. Den här integrationen gör det möjligt för företag och utvecklare att skapa konversations-AI med röster som låter mänskliga, känns uttrycksfulla och svarar i realtid direkt från Twilios CPaaS-plattform. Vi på ElevenLabs är glada att Twilio valt oss för att göra ConversationRelay ännu mer uttrycksfullt och mänskligt.”
API:er byggda för produktion

Vanliga frågor
Senaste nytt

.webp&w=3840&q=80)




ElevenLabs OSS Engineers Fund: stödjer de open-source-projekt som formar vårt arbete
.webp&w=3840&q=80)
Lägg till en tomteröst-agent i din React-app på några minuter

Vi presenterar ElevenLabs UI: Öppen källkod för ljud- och agentkomponenter på webben
.webp&w=3840&q=80)
ElevenLabs Agents vs OpenAI Realtime API: Jämförelse av Konversationsagenter