
Introducing Experiments in ElevenAgents
The most data-driven way to improve real-world agent performance.
Wir haben Multi-Region-Serving für unsere Text to Speech API eingeführt. Anfragen werden jetzt automatisch an das nächstgelegene Backend (USA, Niederlande oder Singapur) weitergeleitet und liefern so eine schnellere Time to First Byte (TTFB) – ganz ohne Code-Änderungen.
Wenn Sie api.elevenlabs.io aufrufen, leitet unsere Infrastruktur je nach Standort an das optimale Backend weiter:
Sie können Ihre Region über den x-Region-Header in der API-Antwort prüfen.
Mit verbesserten GPUs und einem optimierten Inferenz-Stack erreicht Flash v2.5 eine Modell-TTFB von 50 ms. Durch das verbesserte Netzwerk-Routing sinkt die wahrgenommene Latenz deutlich.
Gemessene TTFB-Verbesserungen an 11 globalen Standorten:
Für die meisten internationalen Entwickler bedeutet das eine Reduzierung der wahrgenommenen Latenz um 20–40 %.
Für Voice Agents und Echtzeitanwendungen bedeuten 150 ms weniger Latenz natürlichere Gespräche, bessere Reaktionszeiten und ein konsistentes Nutzererlebnis – unabhängig vom Standort. Zusammen mit der Inferenzgeschwindigkeit von Flash v2.5 ist dies die schnellste agentische Text to Speech-Lösung.
Keine Migration erforderlich. Wenn Sie api.elevenlabs.io verwenden, ist das globale Routing bereits aktiv.
Um das globale Routing zu deaktivieren und immer US-Server zu nutzen, verwenden Sie die api.us.elevenlabs.io-Basis-URL für Ihre API-Anfragen.
Siehe unser Leitfaden zur Latenzoptimierung für weitere Best Practices. Unternehmenskunden mit Anforderungen an regionale Datenspeicherung können den Vertrieb kontaktieren.

The most data-driven way to improve real-world agent performance.
.webp&w=3840&q=95)
UK AI Security Institute researchers will explore the implications of AI voice technology