
Introducing Experiments in ElevenAgents
The most data-driven way to improve real-world agent performance.
Nous avons déployé la gestion multi-région pour notre API Text to Speech. Les requêtes sont désormais automatiquement dirigées vers le serveur le plus proche (États-Unis, Pays-Bas ou Singapour), ce qui permet un temps de réponse plus rapide sans aucun changement de code.
Lorsque vous appelez api.elevenlabs.io, notre infrastructure choisit automatiquement le serveur optimal selon votre localisation :
Vous pouvez vérifier votre région de service via l’en-tête x-région dans la réponse de l’API.
Grâce à des GPU plus performants et une pile d’inférence optimisée, Flash v2.5 atteint 50 ms pour le premier octet, et les améliorations du routage réseau réduisent encore la latence perçue.
Améliorations du TTFB mesurées sur 11 sites dans le monde :
Pour la plupart des développeurs internationaux, cela représente une réduction de 20 à 40 % de la latence perçue.
Pour les agents vocaux et les applications en temps réel, 150 ms de latence en moins permettent des conversations plus naturelles, une meilleure réactivité et une expérience homogène pour tous les utilisateurs, où qu’ils soient. Combiné à la vitesse d’inférence de Flash v2.5, c’est la solution Text to Speech la plus rapide pour les agents.
Aucune migration nécessaire. Si vous utilisez api.elevenlabs.io, le routage mondial est déjà actif.
Pour désactiver le routage mondial et utiliser uniquement les serveurs aux États-Unis, utilisez l’URL de base api.us.elevenlabs.io pour vos requêtes API.
Consultez notre guide d’optimisation de la latence pour d’autres bonnes pratiques. Les entreprises ayant besoin de stocker les données dans une région spécifique peuvent contacter notre équipe commerciale.

The most data-driven way to improve real-world agent performance.
.webp&w=3840&q=95)
UK AI Security Institute researchers will explore the implications of AI voice technology