
Voice Design - La prima IA generativa per l’audio
- Categoria
- Prodotto
- Data
Abbiamo introdotto il multi-region serving per la nostra Text to Speech API. Ora le richieste vengono instradate automaticamente al backend più vicino (USA, Paesi Bassi o Singapore), offrendo un tempo di risposta iniziale (TTFB) più rapido senza bisogno di modificare il codice.
Quando chiami api.elevenlabs.io, la nostra infrastruttura instrada verso il backend ottimale in base alla tua posizione:
Puoi verificare la tua regione di serving tramite l’header x-region nella risposta dell’API.
Con GPU potenziate e uno stack di inferenza ottimizzato, Flash v2.5 raggiunge 50ms di tempo modello al primo byte; grazie anche ai miglioramenti nel routing di rete, la latenza percepita si riduce notevolmente.
Miglioramenti TTFB misurati in 11 località globali:
Per la maggior parte degli sviluppatori internazionali, questo significa una riduzione della latenza percepita tra il 20% e il 40%.
Per agenti vocali e applicazioni in tempo reale, 150ms in meno di latenza rendono le conversazioni più naturali, migliorano la reattività e garantiscono un’esperienza uniforme agli utenti ovunque si trovino. Insieme alla velocità di inferenza di Flash v2.5, questa è la Text to Speech agentica più veloce disponibile.
Non serve alcuna migrazione. Se utilizzi api.elevenlabs.io, il routing globale è già attivo.
Per disattivare il routing globale e usare sempre i server USA, utilizza la api.us.elevenlabs.io base URL per le tue richieste API.
Consulta la nostra guida all’ottimizzazione della latenza per ulteriori best practice. I clienti enterprise che necessitano della residenza dei dati in una specifica regione possono contattare il team commerciale.



