.webp&w=3840&q=80)
Testare gli agenti conversazionali IA
- Categoria
- ElevenAPI
- Data
Abbiamo introdotto la redazione integrata delle entità, una trascrizione Indic-English migliorata, la nuova modalità No Verbatim e la possibilità di suggerire fino a 1.000 termini chiave.
Questi miglioramenti danno agli sviluppatori più controllo su privacy, accuratezza multilingue, qualità delle trascrizioni e precisione su termini specifici di settore.
Ora Scribe v2 può rilevare e oscurare automaticamente le entità sensibili nelle trascrizioni, come nomi, numeri di carte di credito, numeri di previdenza sociale e altre informazioni personali identificabili.
La redazione avviene durante la trascrizione. I dati sensibili vengono rimossi prima che arrivino al tuo storage o ad altri sistemi collegati.
Così i team possono condividere le trascrizioni più facilmente e gestire i workflow dei dati in ambiti come sanità, finanza e assistenza clienti.
In India, chi parla spesso alterna l’inglese con hindi, telugu, kannada e altre lingue indiane. Molti sistemi di trascrizione traslitterano le parole inglesi in caratteri indiani, producendo trascrizioni che non riflettono il modo reale di comunicare.
Scribe v2 trascrive le parole inglesi in inglese, indipendentemente dalla lingua circostante. Funziona in automatico, senza bisogno di configurare la lingua. Che tu inserisca inglese, hindi o nessun codice lingua, le parole inglesi restano in caratteri latini.
Questo vale per tutte le lingue indiane, non solo per l’hindi-inglese. Se chi parla passa da telugu a inglese o da kannada a inglese, le parti in inglese vengono trascritte correttamente.
Abbiamo introdotto la modalità No Verbatim, un’impostazione che rimuove automaticamente intercalari come "ehm" e "uh", oltre a ripetizioni e balbettii.
Il risultato è una trascrizione pulita e leggibile, senza bisogno di modifiche manuali o post-produzione.
La modalità No Verbatim è ideale per note di riunioni, sottotitoli e in tutti i workflow in cui serve un testo curato invece di una registrazione grezza di ogni suono.
Ora puoi suggerire fino a 1.000 parole e frasi chiave per trascrizione, rispetto al limite precedente di 100.
Questo offre più spazio a chi lavora con vocabolari tecnici ampi, cataloghi di prodotto o terminologia di settore per guidare il modello verso una trascrizione più precisa.
Il suggerimento di termini chiave resta contestuale: il modello usa l’audio circostante per capire se un termine va inserito, invece di aggiungerlo a caso. Con 1.000 termini, la capacità è 10 volte superiore rispetto a prima.
Nota: le richieste con più di 100 termini chiave hanno un’unità minima fatturabile di 20 secondi.
Queste funzioni sono già disponibili nell’API e nell’interfaccia di Scribe v2.
Leggi la documentazione:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart
Provalo nell’app:
https://elevenlabs.io/app/speech-to-text
.webp&w=3840&q=80)
.webp&w=3840&q=80)

