
Découvrez les Expériences dans ElevenAgents
- Catégorie
- Produit
- Date
Nous avons déployé la gestion multi-région pour notre API Text to Speech. Les requêtes sont désormais automatiquement dirigées vers le serveur le plus proche (États-Unis, Pays-Bas ou Singapour), ce qui permet un temps de réponse initial (TTFB) plus rapide, sans modification de code.
Quand vous appelez api.elevenlabs.io, notre infrastructure choisit automatiquement le serveur optimal selon votre localisation :
Vous pouvez vérifier votre région de service via l’en-tête x-region dans la réponse de l’API.
Grâce à des GPU plus performants et une pile d’inférence optimisée, Flash v2.5 atteint 50 ms de temps de réponse initial, et les améliorations de routage réseau réduisent encore la latence perçue.
Améliorations du TTFB mesurées sur 11 sites dans le monde :
Pour la plupart des développeurs internationaux, cela représente une réduction de 20 à 40 % de la latence perçue.
Pour les agents vocaux et les applications en temps réel, 150 ms de latence en moins rendent les conversations plus naturelles, améliorent la réactivité et offrent une expérience homogène, peu importe la région. Combiné à la vitesse d’inférence de Flash v2.5, c’est le Text to Speech agentique le plus rapide disponible.
Aucune migration nécessaire. Si vous utilisez api.elevenlabs.io, le routage mondial est déjà actif.
Pour désactiver le routage mondial et utiliser uniquement les serveurs aux États-Unis, utilisez l’URL de base api.us.elevenlabs.io pour vos requêtes API.
Consultez notre guide d’optimisation de la latence pour d’autres bonnes pratiques. Les clients entreprise ayant besoin de résidence régionale des données peuvent contacter notre équipe commerciale.



.webp&w=3840&q=80)
