.webp&w=3840&q=80)
Tworzenie Vibe Draw: połączenie ElevenLabs z FLUX Kontext do tworzenia obrazów za pomocą głosu
- Kategoria
- Deweloper
- Data
Wprowadzamy wbudowane ukrywanie danych, lepszą transkrypcję Indic-English, nowy tryb No Verbatim i podpowiadanie słów kluczowych do 1 000 haseł.
Te zmiany dają deweloperom większą kontrolę nad prywatnością, dokładnością w wielu językach, jakością transkrypcji i precyzją w konkretnych branżach.
Scribe v2 potrafi teraz automatycznie wykrywać i ukrywać wrażliwe dane w transkrypcjach – w tym imiona, numery kart, numery ubezpieczenia społecznego i inne dane osobowe.
Ukrywanie danych odbywa się podczas transkrypcji. Wrażliwe informacje są usuwane, zanim trafią do twojego magazynu lub innych systemów.
To szczególnie ważne dla zespołów w ochronie zdrowia, finansach i obsłudze klienta, gdzie przepisy wymagają usuwania danych osobowych przed zapisaniem lub udostępnieniem transkrypcji.
W Indiach wiele osób miesza angielski z hindi, telugu, kannada i innymi językami. Wiele systemów transkrypcji zapisuje angielskie słowa w indyjskich alfabetach, przez co transkrypcje nie oddają prawdziwej mowy.
Scribe v2 zapisuje angielskie słowa po angielsku, niezależnie od otaczającego języka. Działa to automatycznie, bez ustawiania języka. Niezależnie czy podasz angielski, hindi czy nie podasz kodu języka, angielskie słowa zostają w łacińskim alfabecie.
Dotyczy to wszystkich języków indyjskich, nie tylko hindi-angielski. Jeśli ktoś przechodzi z telugu na angielski lub z kannada na angielski, angielskie fragmenty są zapisane poprawnie.
Wprowadzamy tryb No Verbatim – ustawienie, które automatycznie usuwa wypełniacze typu „yyy”, „eee”, powtórzenia i jąkanie.
Dzięki temu dostajesz czytelną transkrypcję bez ręcznej edycji.
Tryb No Verbatim świetnie sprawdza się w notatkach ze spotkań, napisach i wszędzie tam, gdzie liczy się przejrzysty tekst, a nie każdy dźwięk.
Podpowiadanie słów kluczowych obsługuje teraz do 1 000 słów i fraz na transkrypcję – wcześniej było to 100.
To daje zespołom z dużym słownictwem technicznym, katalogami produktów czy specjalistyczną terminologią więcej możliwości, by kierować modelem do dokładnej transkrypcji.
Podpowiadanie słów kluczowych nadal bierze pod uwagę kontekst. Model sprawdza otaczające nagranie, zanim użyje danego słowa. Przy 1 000 słowach to 10 razy więcej niż wcześniej.
Uwaga: Przy więcej niż 100 słowach kluczowych minimalna jednostka rozliczeniowa to 20 sekund.
Te funkcje są już dostępne w Scribe v2 API i w panelu.
Zobacz dokumentację:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart
Wypróbuj w aplikacji:
https://elevenlabs.io/app/speech-to-text
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)