Salta al contenuto

Trascrizione vocale in tempo reale

Trascrivi la voce dal vivo all’istante

Scribe v2 Realtime è il modello di trascrizione in tempo reale più preciso, con una latenza di 150 ms in oltre 90 lingue. Disponibile tramite API.

Ti presentiamo Scribe v2 Realtime, pensato per velocità e precisione

Ultra-veloce, ultra-preciso e pensato per la voce dal vivo. Scribe v2 Realtime offre trascrizione istantanea per agenti, riunioni e IA conversazionale.

Alta precisione

Addestrato su dati globali e ottimizzato per il parlato naturale, Scribe raggiunge i migliori Word Error Rate del settore nelle principali lingue e accenti.

Scribe supera tutti i modelli concorrenti nei benchmark di precisione

Latenza ultra-bassa

Trasmetti audio e ricevi trascrizioni in circa 150 ms, per una comprensione in tempo reale con agenti dal vivo, riunioni e IA conversazionale.

Voce in tempo reale per agenti, app e ogni lingua

Scribe Card background
Live call
I’m
happy
to
help.
What’s
your
email
address?
It’s
john.doe@me.com
Thanks.
And
your
phone
number?
1-800-404

Pensato per agenti e app vocali

Scribe v2 Realtime è pensato per sviluppatori che creano agenti conversazionali, assistenti per riunioni e applicazioni vocali dove velocità e precisione sono fondamentali.

Japanese
Hindi
Polish
Swedish
Mandarin
Vietnamese
French

Cattura la voce con precisione in 90 lingue

Scribe v2 Realtime garantisce comprensione ovunque, offrendo una precisione eccezionale in 90 lingue e gestendo facilmente accenti, dialetti e condizioni acustiche diverse.

Formati audio multipli

Supporta PCM (8–48 kHz) e codifica μ-law per la compatibilità con telefonia, browser e studio.

Rilevamento attività vocale

Rileva quando la voce inizia e finisce, segmentando l’audio con precisione per una trascrizione fluida ed efficiente in tempo reale.

Controllo Manual Commit

Dà agli sviluppatori il controllo su quando finalizzare le trascrizioni – ideale per streaming personalizzati e precisione su misura.

Riconoscimento vocale progettato per prestazioni in tempo reale

V2
V1
V2

Basato su una nuova generazione di modelli

Basato sulle fondamenta di Scribe v1, Scribe v2 Realtime offre una latenza di circa 150 ms con una precisione rivoluzionaria su accenti, toni e ambienti.

Scribe
makes
uses
is
has
new

Trascrizione predittiva per latenza minima

Scribe v2 Realtime utilizza la trascrizione predittiva per anticipare le parole e la punteggiatura più probabili, garantendo precisione in tempo reale.

Vocabolario complesso

Supporto integrato per vocabolario complesso, inclusi termini tecnici, farmaci e nomi propri.

Supporto streaming

Invia audio in flussi continui e ricevi trascrizioni dal vivo all’istante – senza buffering, solo comprensione in tempo reale.

Condizionamento del testo

Scribe v2 Realtime continua la trascrizione senza interruzioni anche in caso di reset della connessione.

Sicurezza e infrastruttura di livello enterprise su larga scala

Foreground

Precisione senza paragoni, anche negli ambienti più complessi

Scribe Background 2

Natural Speech

Filler words, pauses and emotional cues

Scribe 1

Low-quality Audio

Background noise or low-bandwidth audio

Scribe background 4

Accents

Diverse accents and pronunciations

Scribe background 3

Domain Terms

Acronyms, brands, financial or medical terms

Pensato per ogni workflow, dagli agenti alla produzione

ElevenLabs Agents

Gestisci interazioni vocali in tempo reale e IA conversazionale con trascrizione istantanea e a bassa latenza. Scribe v2 Realtime permette agli agenti di ascoltare, capire e rispondere più velocemente che mai.

Agents Graphic - scribe

API Scribe Realtime

Integra la trascrizione Speech-to-Text ultra-rapida direttamente nel tuo prodotto con una semplice WebSocket o REST API. Trasmetti l’audio in tempo reale e ricevi il testo preciso in meno di 100 ms.

Scribe code snippet

Prezzi flessibili in base alle tue esigenze

Sperimenta la massima precisione e reattività con prezzi pensati per crescere da startup a team enterprise.

$0,28 all’ora e meno

con i piani Business annuali

UI Screenshot

Domande frequenti

Ultimi aggiornamenti

Crea con l'audio IA della massima qualità