Text to Speech API – Bis zu 40 % schneller weltweit
- Verfasst von
- Joe Reeve
- Veröffentlicht
AnhörenArtikel anhören
Wir haben Multi-Region-Serving für unsere Text to Speech API eingeführt. Anfragen werden jetzt automatisch an das nächstgelegene Backend (USA, Niederlande oder Singapur) weitergeleitet – für schnellere Time to First Byte (TTFB), ohne dass Änderungen am Code nötig sind.
Was sich geändert hat
Wenn Sie api.elevenlabs.io aufrufen, leitet unsere Infrastruktur Sie je nach Standort an das optimale Backend weiter:
- Amerika: US-Central
- Europa, Naher Osten, Afrika: Niederlande
- Asien-Pazifik: Singapur
Sie können Ihre Region über den x-region-Header in der API-Antwort prüfen.
Leistung
Mit verbesserten GPUs und einem optimierten Inferenz-Stack erreicht Flash v2.5 eine Modell-TTFB von 50 ms. Durch das neue Netzwerk-Routing wird die wahrgenommene Latenz deutlich reduziert.
Gemessene TTFB-Verbesserungen an 11 globalen Standorten:
Für die meisten internationalen Entwickler sinkt die wahrgenommene Latenz damit um 20–40 %.
Warum das wichtig ist
Für Voice Agents und Echtzeitanwendungen bedeuten 150 ms weniger Latenz natürlichere Gespräche, bessere Reaktionszeiten und ein konsistentes Nutzererlebnis – unabhängig vom Standort. In Kombination mit der Inferenzgeschwindigkeit von Flash v2.5 ist dies die schnellste agentenbasierte Text to Speech-Lösung.
Jetzt starten
Keine Migration erforderlich. Wenn Sie api.elevenlabs.io nutzen, ist das globale Routing bereits aktiv.
Wenn Sie das globale Routing deaktivieren und immer US-Server nutzen möchten, verwenden Sie die api.us.elevenlabs.io-Basis-URL für Ihre API-Anfragen.
Lesen Sie unseren Leitfaden zur Latenzoptimierung für weitere Best Practices. Unternehmenskunden mit Anforderungen an regionale Datenspeicherung können unser Vertriebsteam kontaktieren.



.webp&w=3840&q=80)
