跳到内容

WebSocket 优化:更高可靠性与自定义超时

长音频生成更稳定,支持自定义空闲超时

A digital illustration of a web socket with interconnected nodes and lines surrounding it.

我们对 WebSocket API 进行了更新,让长音频生成过程更稳定。此次优化解决了长时间生成时音色变机械或音质变差的问题,保证全程音质一致。下方展示了长音频生成前后的音色变化:

优化前

 / 
 / 

优化后

 / 
 / 

现在 WebSocket 连接支持自定义空闲超时,最长可达 180 秒。默认仍为 20 秒,可根据需求延长。

只需在 WebSocket 地址中添加 inactivity_timeout 查询参数即可调整:

wss://api.elevenlabs.io/v1/text-to-speech/{voice_id}/stream-input?model_id=eleven_turbo_v2&inactivity_timeout=180

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作