
Experimente in ElevenAgents
- Kategorie
- Produkte
- Datum
Wir haben Multi-Region-Serving für unsere Text to Speech API eingeführt. Anfragen werden jetzt automatisch an das nächstgelegene Backend (USA, Niederlande oder Singapur) weitergeleitet – für schnellere Time to First Byte (TTFB), ohne dass Änderungen am Code nötig sind.
Wenn Sie api.elevenlabs.io aufrufen, leitet unsere Infrastruktur Sie je nach Standort an das optimale Backend weiter:
Sie können Ihre Region über den x-region-Header in der API-Antwort prüfen.
Mit verbesserten GPUs und einem optimierten Inferenz-Stack erreicht Flash v2.5 eine Modell-TTFB von 50 ms. Durch das neue Netzwerk-Routing wird die wahrgenommene Latenz deutlich reduziert.
Gemessene TTFB-Verbesserungen an 11 globalen Standorten:
Für die meisten internationalen Entwickler sinkt die wahrgenommene Latenz damit um 20–40 %.
Für Voice Agents und Echtzeitanwendungen bedeuten 150 ms weniger Latenz natürlichere Gespräche, bessere Reaktionszeiten und ein konsistentes Nutzererlebnis – unabhängig vom Standort. In Kombination mit der Inferenzgeschwindigkeit von Flash v2.5 ist dies die schnellste agentenbasierte Text to Speech-Lösung.
Keine Migration erforderlich. Wenn Sie api.elevenlabs.io nutzen, ist das globale Routing bereits aktiv.
Wenn Sie das globale Routing deaktivieren und immer US-Server nutzen möchten, verwenden Sie die api.us.elevenlabs.io-Basis-URL für Ihre API-Anfragen.
Lesen Sie unseren Leitfaden zur Latenzoptimierung für weitere Best Practices. Unternehmenskunden mit Anforderungen an regionale Datenspeicherung können unser Vertriebsteam kontaktieren.



.webp&w=3840&q=80)