Quando verrà integrato Scribe v2 Realtime nella tua piattaforma Agents?

Scribe v2 Realtime è integrato nella piattaforma agents come opzione, ma non sarà ancora il modello predefinito.

Qual è il limite di concorrenza per Scribe v2 Realtime?

Sarà 30+ per i clienti enterprise. Simile a Turbo/Flash TTS.

Offrite la diarizzazione degli speaker?

Alcuni provider che offrono diarizzazione degli speaker in tempo reale, come Deepgram, hanno grossi problemi con le lingue non inglesi. Al momento non è una priorità per un modello realtime.

Sarà supportato il doppio canale con Scribe v2 Realtime?

No, il supporto al doppio canale non è previsto.

Trascrizione vocale in tempo reale

Trascrivi la voce dal vivo all’istante

Inizia a trascrivere Esplora la documentazione

Scribe v2 Realtime è il modello di trascrizione in tempo reale più preciso, con una latenza di 150 ms in oltre 90 lingue. Disponibile tramite API.

Ti presentiamo Scribe v2 Realtime, pensato per velocità e precisione

Ultra-veloce, ultra-preciso e pensato per la voce dal vivo. Scribe v2 Realtime offre trascrizione istantanea per agenti, riunioni e IA conversazionale.

Alta precisione

Addestrato su dati globali e ottimizzato per il parlato naturale, Scribe raggiunge i migliori Word Error Rate del settore nelle principali lingue e accenti.

Latenza ultra-bassa

Trasmetti audio e ricevi trascrizioni in circa 150 ms, per una comprensione in tempo reale con agenti dal vivo, riunioni e IA conversazionale.

Voce in tempo reale per agenti, app e ogni lingua

Live call

I’m

happy

help.

What’s

your

address?

It’s

john.doe@me.com

Thanks.

And

your

phone

number?

1-800-404

Pensato per agenti e app vocali

Scribe v2 Realtime è pensato per sviluppatori che creano agenti conversazionali, assistenti per riunioni e applicazioni vocali dove velocità e precisione sono fondamentali.

Japanese

Hindi

Polish

Swedish

Mandarin

Vietnamese

French

Cattura la voce con precisione in 90 lingue

Scribe v2 Realtime garantisce comprensione ovunque, offrendo una precisione eccezionale in 90 lingue e gestendo facilmente accenti, dialetti e condizioni acustiche diverse.

Formati audio multipli

Supporta PCM (8–48 kHz) e codifica μ-law per la compatibilità con telefonia, browser e studio.

Rilevamento attività vocale

Rileva quando la voce inizia e finisce, segmentando l’audio con precisione per una trascrizione fluida ed efficiente in tempo reale.

Controllo Manual Commit

Dà agli sviluppatori il controllo su quando finalizzare le trascrizioni – ideale per streaming personalizzati e precisione su misura.

Riconoscimento vocale progettato per prestazioni in tempo reale

Basato su una nuova generazione di modelli

Basato sulle fondamenta di Scribe v1, Scribe v2 Realtime offre una latenza di circa 150 ms con una precisione rivoluzionaria su accenti, toni e ambienti.

Scribe

makes

uses

has

new

Trascrizione predittiva per latenza minima

Scribe v2 Realtime utilizza la trascrizione predittiva per anticipare le parole e la punteggiatura più probabili, garantendo precisione in tempo reale.

Vocabolario complesso

Supporto integrato per vocabolario complesso, inclusi termini tecnici, farmaci e nomi propri.

Supporto streaming

Invia audio in flussi continui e ricevi trascrizioni dal vivo all’istante – senza buffering, solo comprensione in tempo reale.

Condizionamento del testo

Scribe v2 Realtime continua la trascrizione senza interruzioni anche in caso di reset della connessione.

Sicurezza e infrastruttura di livello enterprise su larga scala

Precisione senza paragoni, anche negli ambienti più complessi

Natural Speech

Filler words, pauses and emotional cues

Low-quality Audio

Background noise or low-bandwidth audio

Accents

Diverse accents and pronunciations

Domain Terms

Acronyms, brands, financial or medical terms

Pensato per ogni workflow, dagli agenti alla produzione

ElevenLabs Agents

Gestisci interazioni vocali in tempo reale e IA conversazionale con trascrizione istantanea e a bassa latenza. Scribe v2 Realtime permette agli agenti di ascoltare, capire e rispondere più velocemente che mai.

Crea agente Esplora la documentazione

API Scribe Realtime

Integra la trascrizione Speech-to-Text ultra-rapida direttamente nel tuo prodotto con una semplice WebSocket o REST API. Trasmetti l’audio in tempo reale e ricevi il testo preciso in meno di 100 ms.

Esplora la documentazione