Pomiń

Scribe v2 właśnie dostał aktualizację

Scribe v2 Upgrade 1 1

Wprowadzamy wbudowane ukrywanie danych, lepszą transkrypcję Indic-English, nowy tryb No Verbatim i podpowiadanie słów kluczowych do 1 000 haseł.

Te zmiany dają deweloperom większą kontrolę nad prywatnością, dokładnością w wielu językach, jakością transkrypcji i precyzją w konkretnych branżach.

Nowe ukrywanie danych w Scribe v2

Scribe v2 potrafi teraz automatycznie wykrywać i ukrywać wrażliwe dane w transkrypcjach – w tym imiona, numery kart, numery ubezpieczenia społecznego i inne dane osobowe.

Ukrywanie danych odbywa się podczas transkrypcji. Wrażliwe informacje są usuwane, zanim trafią do twojego magazynu lub innych systemów.

  • Pełne ukrycie: zamienia dane na [REDACTED];
  • Kategoryzacja: zamienia na typ danych, np. [CREDIT_CARD];
  • Numeracja: zamienia na kategoryzowaną i ponumerowaną etykietę, np. [CREDIT_CARD_1].

To szczególnie ważne dla zespołów w ochronie zdrowia, finansach i obsłudze klienta, gdzie przepisy wymagają usuwania danych osobowych przed zapisaniem lub udostępnieniem transkrypcji.

Dokładne rozpoznawanie Indic-English

W Indiach wiele osób miesza angielski z hindi, telugu, kannada i innymi językami. Wiele systemów transkrypcji zapisuje angielskie słowa w indyjskich alfabetach, przez co transkrypcje nie oddają prawdziwej mowy.

Scribe v2 zapisuje angielskie słowa po angielsku, niezależnie od otaczającego języka. Działa to automatycznie, bez ustawiania języka. Niezależnie czy podasz angielski, hindi czy nie podasz kodu języka, angielskie słowa zostają w łacińskim alfabecie.

Dotyczy to wszystkich języków indyjskich, nie tylko hindi-angielski. Jeśli ktoś przechodzi z telugu na angielski lub z kannada na angielski, angielskie fragmenty są zapisane poprawnie.

Tryb No Verbatim dla czystych transkrypcji

Wprowadzamy tryb No Verbatim – ustawienie, które automatycznie usuwa wypełniacze typu „yyy”, „eee”, powtórzenia i jąkanie.

Dzięki temu dostajesz czytelną transkrypcję bez ręcznej edycji.

Tryb No Verbatim świetnie sprawdza się w notatkach ze spotkań, napisach i wszędzie tam, gdzie liczy się przejrzysty tekst, a nie każdy dźwięk.

Podpowiadanie słów kluczowych do 1 000

Podpowiadanie słów kluczowych obsługuje teraz do 1 000 słów i fraz na transkrypcję – wcześniej było to 100.

To daje zespołom z dużym słownictwem technicznym, katalogami produktów czy specjalistyczną terminologią więcej możliwości, by kierować modelem do dokładnej transkrypcji.

Podpowiadanie słów kluczowych nadal bierze pod uwagę kontekst. Model sprawdza otaczające nagranie, zanim użyje danego słowa. Przy 1 000 słowach to 10 razy więcej niż wcześniej.

Uwaga: Przy więcej niż 100 słowach kluczowych minimalna jednostka rozliczeniowa to 20 sekund.

Dostępne już teraz

Te funkcje są już dostępne w Scribe v2 API i w panelu.

Zobacz dokumentację:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart

Wypróbuj w aplikacji:
https://elevenlabs.io/app/speech-to-text

Przeglądaj artykuły zespołu ElevenLabs

Twórz z najwyższej jakości audio AI