Vi presenterar Scribe v2

Idag presenterar vi Scribe v2: den mest exakta transkriptionsmodellen som någonsin släppts, med stöd för mer än 90 språk.

Introducing Scribe v2

Scribe v2 är byggd för batchtranskription, undertextning och textning i stor skala. Den förbättrar stabiliteten och noggrannheten hos Scribe v1, med bättre hantering av långformsljud, pauser, tonförändringar och långa tystnader.

Introducing Scribe v2

Medan Scribe v2 Realtime är optimerad för ultra låg latens och agentanvändning, är Scribe v2 optimerad för långa och komplexa inspelningar, och bibehåller noggrannhet över olika talare, accenter och leveransstilar. Resultatet är konsekvent tillförlitliga transkriptioner över ett brett spektrum av verkliga ljudförhållanden.


Scribe v2 uppnår den lägsta felprocenten för ord som registrerats på industristandardiserade riktmärken.

Scribe v2 FLEURS benchmark

Nyckeltermspromptning för kontextmedveten transkription

Nyckeltermspromptning går bortom standardanpassat ordförråd genom att använda transkriptets kontext. Välj upp till 100 ord eller fraser, och Scribe v2 kommer noggrant att avgöra när dessa termer ska transkriberas. Detta gör den väl lämpad för tekniska områden, varumärken och branschspecifikt språk.

Scribe v2 keyterm prompting

Inbyggd entitetsdetektion med exakta tidsstämplar

Scribe v2 inkluderar inbyggd entitetsdetektion för strukturerad ljudanalys.

Du kan välja upp till 56 kategorier inom personligt identifierbar information, hälsodata eller betalningsuppgifter. Scribe v2 kommer automatiskt att upptäcka dessa instanser och deras exakta tidsstämplar i ditt transkript, vilket gör det enklare att granska, redigera eller bearbeta känslig information i stor skala.

Läs mer i API-dokumentationen: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Automatisk flerspråkig transkription

Scribe v2 stöder smarta flerspråkiga arbetsflöden direkt.

Du kan skicka ljud som innehåller flera språk i en enda fil. Modellen upptäcker automatiskt varje språk och transkriberar det korrekt utan manuell segmentering eller konfiguration.

Ytterligare funktioner för produktionsarbetsflöden

Scribe v2 inkluderar en uppsättning funktioner designade för företags- och utvecklaranvändning:

  • Smart talardiari för tydlig, intuitiv talarmärkning
  • Exakta ordnivåtidsstämplar för korrekt undertextjustering och interaktiva upplevelser
  • Dynamisk ljudtaggning som upptäcker icke-talhändelser som skratt eller fotsteg
  • Företagsberedskap med SOC 2, ISO 27001, PCI DSS L1, HIPAA och GDPR-efterlevnad, EU och Indien datalagring, och stöd för noll retention-läge

Scribe v2, nu i ElevenLabs Studio

Scribe v2 används nu i ElevenLabs Studio för mer exakta undertexter, textningar och transkriptioner, och stödjer team som hanterar stora bibliotek av ljud och video inom marknadsföring, media, forskning, utbildning och efterlevnad.

Scribe v2 in Studio

Prova nu: https://elevenlabs.io/app/studio

Bygg med API:et

Med Scribe v2 kan utvecklare och företag automatisera komplexa ljudflöden, förbättra noggrannheten i globala innehållsarbetsflöden och skala säkert med fullständig efterlevnad och datalagringskontroller.

Scribe v2 Keyterm prompting code snippet

Scribe v2 är tillgänglig idag via vårt API och Creative-plattform.

Prova nu: https://elevenlabs.io/app/speech-to-text

Läs dokumentationen: https://elevenlabs.io/docs/capabilities/speech-to-text

Registrera dig här: https://elevenlabs.io/speech-to-text

Utforska artiklar av ElevenLabs-teamet

ElevenLabs

Skapa ljud och röster som imponerar med de bästa AI-verktygen

Kom igång gratis

Har du redan ett konto? Logga in