
Introducing Experiments in ElevenAgents
The most data-driven way to improve real-world agent performance.
Hemos implementado el servicio multi-región para nuestra API de Texto a Voz. Ahora las solicitudes se enrutan automáticamente al backend más cercano (EE. UU., Países Bajos o Singapur), ofreciendo un tiempo de respuesta inicial (TTFB) más rápido sin que tengas que cambiar nada en tu código.
Cuando llamas a api.elevenlabs.io, nuestra infraestructura elige el backend óptimo según tu ubicación:
Puedes comprobar tu región de servicio en la cabecera x-región de la respuesta de la API.
Con GPUs mejoradas y una pila de inferencia optimizada, Flash v2.5 alcanza 50 ms de tiempo de respuesta inicial del modelo, y junto con las mejoras en el enrutamiento de red, se consigue una gran reducción en la latencia percibida.
Mejoras medidas en TTFB en 11 ubicaciones globales:
Para la mayoría de desarrolladores internacionales, esto supone una reducción del 20-40% en la latencia percibida.
Para agentes de voz y aplicaciones en tiempo real, reducir la latencia en 150 ms significa conversaciones más naturales, mejor respuesta y una experiencia consistente para usuarios sin importar su ubicación. Junto con la velocidad de inferencia de Flash v2.5, esta es la solución de Texto a Voz más rápida para agentes.
No necesitas migrar nada. Si ya usas api.elevenlabs.io, el enrutamiento global ya está activo.
Si prefieres no usar el enrutamiento global y siempre utilizar servidores en EE. UU., usa la URL base api.us.elevenlabs.io en tus solicitudes a la API.
Consulta nuestra guía de optimización de latencia para ver más buenas prácticas. Si eres cliente empresarial y necesitas residencia regional de datos, puedes contactar con ventas.

The most data-driven way to improve real-world agent performance.
.webp&w=3840&q=95)
UK AI Security Institute researchers will explore the implications of AI voice technology