Möt Scribe

Transkribera tal till text med världens mest exakta ASR-modell

Scribe, vår första Tal till text modellen är världens mest exakta transkriptionsmodell. Byggd för att hantera oförutsägbarheten i verklig ljud, transkriberar Scribe tal på 99 språk, med tidsstämplar på ordnivå, talardiarisering och ljudhändelse-tagging - allt levererat i ett strukturerat svar för sömlös integration.

Scribe är konstruerad för precision. I FLEURS och Common Voice-benchmarktester över 99 språk presterar den konsekvent bättre än ledande modeller som Gemini 2.0 Flash, Whisper Large V3 och Deepgram Nova-3. Oavsett om det handlar om mötes sammanfattningar, filmundertexter eller till och med låttexter, levererar Scribe den lägsta automatiserade transkriptionens felaktighetsgrad i italienska (98,7 %), engelska (96,7 %) och 97 andra språk.

Scribe gör ASR universellt tillgängligt - vilket dramatiskt minskar felen i traditionellt underbetjänade språk som serbiska, kantonesiska och malayalam, där konkurrerande modeller ofta överstiger 40 % felaktiga ord.

Utvecklare kan integrera Scribe idag via vår Tal till text API att få strukturerade JSON-transkript med talardiarisering och tidsstämplar på ordnivå & icke-talshändelsemarkörer (t.ex. skratt). En låg-latensversion för realtidsapplikationer kommer snart att släppas.

Skapare och företag kan använda Scribe direkt via ElevenLabs instrumentpanel att ladda upp ljud- eller videofiler och generera formaterade transkriptioner.

Börja bygga med Scibe:

API-dokumentation $ Försök i ElevenLabs-instrumentpanelen

Bänkar

BLOMMAR - Ord fel hastighet % - 102 språk

Common Voice - Ord fel hastighet % - 102 språk

Bidrag

Forskningsledare, utbildning, arkitektur

Flavio Schneider

Projektledare, förträningsdata, finjusteringsdata

Tim von Känel

Slutsats, Optimeringar

Maximiliano Levi

Forskningsbidragsgiv

Johan Nordberg, Piotr Dabkowski

Frontend

Austin Malerba

Backend

Hristo Stoychev

Dataförvärv

Alex George

Utforska mer

Forskning

Möt Flash

Du har aldrig upplevt människoliknande TTS så snabbt

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in