
Novità: Experiments in ElevenAgents
- Categoria
- Prodotto
- Data
Abbiamo introdotto il multi-region serving per la nostra Text to Speech API. Ora le richieste vengono instradate automaticamente al backend più vicino (USA, Paesi Bassi o Singapore), offrendo un tempo di risposta iniziale (TTFB) più rapido senza bisogno di modificare il codice.
Quando chiami api.elevenlabs.io, la nostra infrastruttura instrada la richiesta verso il backend ottimale in base alla tua posizione:
Puoi verificare la tua regione di serving tramite l'header x-region nella risposta dell'API.
Con GPU potenziate e uno stack di inferenza ottimizzato, Flash v2.5 raggiunge 50ms di tempo modello al primo byte; grazie ai miglioramenti nel routing di rete, la latenza percepita si riduce notevolmente.
Miglioramenti TTFB misurati in 11 località globali:
Per la maggior parte degli sviluppatori internazionali, questo significa una riduzione della latenza percepita tra il 20% e il 40%.
Per agenti vocali e applicazioni in tempo reale, 150ms in meno di latenza rendono le conversazioni più naturali, migliorano la reattività e garantiscono un'esperienza uniforme per gli utenti ovunque si trovino. Insieme alla velocità di inferenza di Flash v2.5, questa è la Text to Speech agentica più veloce disponibile.
Non serve alcuna migrazione. Se utilizzi api.elevenlabs.io, il routing globale è già attivo.
Se vuoi disattivare il routing globale e usare sempre i server USA, utilizza la base URL api.us.elevenlabs.io per le tue richieste API.
Consulta la nostra guida all’ottimizzazione della latenza per ulteriori best practice. I clienti enterprise che necessitano della residenza dei dati regionale possono contattare il reparto vendite.



.webp&w=3840&q=80)
