跳到内容

认识 Flash

从未体验过如此极速的人声 TTS

Flash Blog 1x1

认识 Flash。全新模型,语音生成仅需 75 毫秒,加上应用和网络延迟。

Flash 是我们推荐的低延迟对话式语音智能体专用模型。现在可在我们的对话式 AI 平台.

中使用,或通过 API 直接调用,使用模型 ID “eleven_flash_v2” 和 “eleven_flash_v2_5”:https://elevenlabs.io/docs/api-reference/text-to-speech/convert 

Flash v2 仅支持英文,Flash v2.5 支持 32 种语言。两者均为每 2 个字符消耗 1 个积分

相比 Turbo 模型,音质和情感表现略低,但延迟大幅降低。我们的人类标注员进行盲测时,Eleven Flash 始终优于同类超低延迟模型,是同类中最快且高质量的模型。

查看我们的模型指南,选择最适合的模型:https://elevenlabs.io/docs/developer-guides/models

Quality Latency Tradeoff

期待 Flash 带来更多低延迟、拟人化的对话体验。

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作