
ElevenLabs 完成 5 亿美元 D 轮融资,估值达 110 亿美元
- 分类
- 公司
- 日期
更具表现力的语音智能体,专为真实客户对话打造。
今天,我们为 ElevenAgents 推出 Expressive Mode ——语音智能体,表现力极强,让 AI 与真人对话的界限变得模糊。
Expressive Mode 让团队对语气有前所未有的掌控力,即使在高压下,智能体也能化解冲突、安抚用户,引导对话顺利解决。
以下是智能体在航班取消后,安抚极度沮丧客户的原始录音:

其背后有两项升级:
这两项功能同步开发,完美融合进 ElevenAgents —— 我们一体化的对话式ElevenAgents.
Eleven v3 Conversational 是我们迄今为止最具情感理解力、最懂语境的 TTS 模型,能跨轮次保持对话上下文,语音表达意图、情感和重点,自然流畅,不生硬、不夸张。
例如,当用户表现出担忧时,可以引导智能体用更平和、安抚的语气;需要高效清晰时,则用更直接的语气。这些控制帮助团队让表达方式与品牌和用户预期保持一致。
人类对话不仅靠内容,更靠时机。打断太早会破坏信任,回应太晚则错失时机。
我们的新轮流说话系统基于行业领先的实时转写模型Scribe v2 Realtime,通过实时信号判断说话方式中的情感,更好地决定智能体何时说话、暂停或等待,让回应更贴近真人,尤其在情绪激烈时。
说话速度突然加快、音量升高并重复,通常意味着强烈压力或恐慌:
相反,语调明亮上扬、短促感叹,往往代表愉快的惊喜或松了一口气:
Expressive Mode 支持 70 多种语言,细腻表达情感,提升了如印地语等以往表现欠佳的语言和方言的语音效果。
听听智能体用多种印度语言说话:
还有带阿根廷口音的西班牙语:
部署具备情感表达的智能体,保持品牌一致,及时响应,适应真实客户情绪,让客户感受到帮助,而不是被流程化处理。
在 ElevenAgents 内为生产环境打造,具备大规模客户服务所需的可靠性、集成、测试和监控能力,支持从试点到全球部署。
立即体验:在线演示
查看文档:文档



