.webp&w=3840&q=80)
Skapa Vibe Draw: kombinera ElevenLabs med FLUX Kontext för röststyrd bildskapande
- Kategori
- Utvecklare
- Datum
Vi lanserar inbyggd maskering av känsliga uppgifter, förbättrad Indic-Engelsk transkribering, ett nytt No Verbatim-läge och utökad nyckelordsstyrning upp till 1 000 termer.
De här förbättringarna ger utvecklare mer kontroll över integritet, flerspråkig noggrannhet, transkriptkvalitet och domänspecifik precision.
Scribe v2 kan nu automatiskt upptäcka och maskera känsliga uppgifter i transkript – till exempel namn, kreditkortsnummer, personnummer och annan personligt identifierbar information.
Maskeringen sker under transkriberingen. Känsliga data tas bort innan de når ditt lagringsutrymme eller andra system.
Det här är särskilt relevant för team inom vård, finans och kundsupport, där regler kräver att personuppgifter hanteras innan transkript lagras eller delas.
I Indien blandar talare ofta engelska med hindi, telugu, kannada och andra indiska språk. Många transkriberingssystem translittererar engelska ord till indiska skriftspråk, vilket ger transkript som inte speglar hur folk faktiskt pratar.
Scribe v2 transkriberar engelska ord på engelska, oavsett vilket språk som omger dem. Det fungerar automatiskt, utan att du behöver ställa in språk. Oavsett om du skickar in engelska, hindi eller inget språk alls, skrivs engelska ord med latinska bokstäver.
Det här gäller för alla indiska språk, inte bara hindi-engelska. Om någon växlar mellan telugu och engelska eller kannada och engelska, transkriberas de engelska delarna korrekt.
Vi introducerar No Verbatim-läge, en transkriberingsinställning som automatiskt tar bort utfyllnadsord som "eh" och "öh", samt upprepningar och stamningar.
Resultatet blir ett rent och lättläst transkript utan att du behöver redigera manuellt.
No Verbatim-läget passar perfekt för mötesanteckningar, undertexter och alla arbetsflöden där du vill ha en snygg text istället för en exakt återgivning av allt ljud.
Nyckelordsstyrning stöder nu upp till 1 000 ord och fraser per transkript, jämfört med tidigare gräns på 100.
Det ger team som jobbar med stora tekniska vokabulärer, produktkataloger eller domänspecifika termer mer utrymme att styra modellen mot rätt transkribering.
Nyckelordsstyrning är fortfarande kontextmedveten. Modellen använder omgivande ljud för att avgöra om ett nyckelord ska användas, istället för att bara lägga in ord på måfå. Med 1 000 termer är kapaciteten tio gånger större än tidigare.
Obs: Förfrågningar med fler än 100 nyckelord har en minsta debiterbar enhet på 20 sekunder.
De här funktionerna finns redan nu i Scribe v2 API och gränssnitt.
Läs dokumentationen:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart
Prova i appen:
https://elevenlabs.io/app/speech-to-text
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)