Salta al contenuto

Presentiamo Scribe v2 Realtime

Oggi presentiamo Scribe v2 Realtime, il modello Speech to Text più preciso e a bassa latenza, che offre trascrizione live in meno di 150 ms.

Scribe v2 Realtime

Scribe v2 Realtime: il modello più preciso per la trascrizione live

Scribe v2 Realtime

Scribe v2 Realtime stabilisce un nuovo standard per la bassa latenza nel Speech to Text.

Pensato per casi d’uso in tempo reale—voice agents, assistenti per riunioni e sottotitoli in tempo reale—trascrive la voce in meno di 150 ms in inglese, francese, tedesco, italiano, spagnolo, portoghese e in 90 lingue.

Scribe v2 Realtime benchmark

Scribe v2 Realtime è progettato appositamente per casi d’uso agentici. Su 500 campioni complessi con rumore di fondo e informazioni articolate, supera nettamente tutti gli altri modelli.

Funzionalità principali

  • Latenza negativa: previsione della parola successiva e della punteggiatura
  • Rilevamento automatico della lingua: parla in qualsiasi lingua e cambia lingua durante la conversazione
  • Text conditioning: Scribe v2 Realtime continua la trascrizione in base al batch precedente, utile quando si riavvia una connessione
  • Voice Activity Detection (VAD)
  • Commit manuale: controllo totale su quando finalizzare i segmenti di trascrizione
  • Supporto di più formati audio: compatibile con PCM (48kHz) e codifica μ-law
  • Pronto per l’enterprise con conformità a SOC 2, ISO 27001, PCI DSS L1, HIPAA e GDPR, opzioni di residenza dei dati in UE e India e modalità Zero retention per carichi di lavoro sensibili

Scribe v2 Realtime offre comprensione a livello umano in tempo reale, permettendo conversazioni naturali e risposte immediate in ambienti live. Scribe v2 Realtime raggiunge il 93,5% di accuratezza su 30 lingue europee e asiatiche tra le più usate.

Sviluppa con l’API

Scribe v2 Realtime è già disponibile tramite l’API di ElevenLabs.

Consulta la documentazione: https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

Usa Scribe v2 Realtime in ElevenLabs Agents

Crea agenti vocali naturali e realistici grazie a Scribe v2 Realtime. Sviluppa assistenti vocali per supporto, vendite o esperienze in-app che comprendono e rispondono in tempo reale.

Scopri di più: https://elevenlabs.io/agents

Scribe v2 Realtime for Agents

Inizia a sviluppare oggi stesso

Usa Scribe v2 Realtime tramite la nostra API o direttamente all’interno di ElevenLabs Agents.

Registrati qui: https://elevenlabs.io/app/sign-up

Scopri gli articoli del team ElevenLabs

Crea con l'audio IA della massima qualità