Salta al contenuto

Presentiamo Scribe v2

Oggi presentiamo Scribe v2: il modello di trascrizione più preciso mai rilasciato, con supporto per oltre 90 lingue.

Introducing Scribe v2

Scribe v2 è pensato per la trascrizione in batch, la creazione di sottotitoli e caption su larga scala. Migliora la stabilità e la precisione rispetto a Scribe v1, gestendo meglio audio lunghi, pause, cambi di tono e silenzi prolungati.

Introducing Scribe v2

Mentre Scribe v2 Realtime è ottimizzato per la latenza ultra bassa e i casi d’uso degli agenti, Scribe v2 è pensato per registrazioni lunghe e complesse, mantenendo la precisione anche con speaker diversi, accenti e stili di esposizione differenti. Il risultato sono trascrizioni sempre affidabili in una vasta gamma di condizioni audio reali.


Scribe v2 raggiunge il tasso di errore sulle parole più basso mai registrato nei benchmark di settore.

Scribe v2 FLEURS benchmark

Keyterm Prompting per trascrizioni contestuali

Il keyterm prompting va oltre il classico Custom Vocabulary sfruttando il contesto della trascrizione. Puoi selezionare fino a 100 parole o frasi e Scribe v2 deciderà con precisione quando trascrivere quei termini. È ideale per ambiti tecnici, nomi di brand e linguaggi specifici di settore.

Scribe v2 keyterm prompting

Rilevamento entità integrato con timestamp precisi

Scribe v2 include il rilevamento nativo delle entità per un’analisi strutturata dell’audio.

Puoi scegliere tra 56 categorie che includono dati personali, informazioni sanitarie o dettagli di pagamento. Scribe v2 rileverà automaticamente queste occorrenze e i relativi timestamp esatti nella trascrizione, facilitando la revisione, l’oscuramento o la gestione di informazioni sensibili su larga scala.

Scopri di più nella documentazione API:https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Trascrizione automatica multilingue

Scribe v2 supporta workflow multilingue intelligenti già pronti all’uso.

Puoi inviare file audio che contengono più lingue. Il modello rileva automaticamente ogni lingua e la trascrive correttamente senza bisogno di segmentazione o configurazione manuale.

Funzionalità aggiuntive per workflow di produzione

Scribe v2 offre una serie di funzionalità pensate per aziende e sviluppatori:

  • Diarizzazione intelligente per etichettare chiaramente e in modo intuitivo gli speaker
  • Timestamp precisi a livello di parola per un allineamento accurato dei sottotitoli e esperienze interattive
  • Audio tagging dinamico che rileva eventi non vocali come risate o passi
  • Pronto per l’uso enterprise con conformità SOC 2, ISO 27001, PCI DSS L1, HIPAA e GDPR, residenza dei dati in UE e India e supporto alla modalità zero retention

Scribe v2, ora in ElevenLabs Studio

Scribe v2 è ora integrato in ElevenLabs Studio per sottotitoli, caption e trascrizioni ancora più precisi, a supporto dei team che gestiscono grandi librerie audio e video in ambito marketing, media, ricerca, formazione e conformità.

Scribe v2 in Studio

Provalo ora:https://elevenlabs.io/app/studio

Sviluppa con l’API

Con Scribe v2, sviluppatori e aziende possono automatizzare pipeline audio complesse, migliorare la precisione nei workflow di contenuti globali e scalare in sicurezza con pieno controllo su conformità e residenza dei dati.

Scribe v2 Keyterm prompting code snippet

Scribe v2 è già disponibile tramite la nostra API e la piattaforma Creative.

Provalo ora:https://elevenlabs.io/app/speech-to-text

Leggi la documentazione:https://elevenlabs.io/docs/capabilities/speech-to-text

Registrati qui:https://elevenlabs.io/speech-to-text

Scopri gli articoli del team ElevenLabs

Crea con l'audio IA della massima qualità