跳到内容

ElevenAgents 推出 Expressive Mode

更具表现力的语音智能体,专为真实客户对话打造。

expressive mode

今天,我们为 ElevenAgents 推出 Expressive Mode ——语音智能体,表现力极强,让 AI 与真人对话的界限变得模糊。

Expressive Mode 让团队对语气有前所未有的掌控力,即使在高压下,智能体也能化解冲突、安抚用户,引导对话顺利解决。

以下是智能体在航班取消后,安抚极度沮丧客户的原始录音:

mark screenshot w caption space

Expressive Mode 的两项核心升级

其背后有两项升级:

  • Eleven v3 对话式—— 我们最具情感理解力、最懂语境的文本转语音模型,基于 Eleven v3,专为实时对话优化。
  • 全新轮流说话系统—— 响应时机更准确,打断更少。

这两项功能同步开发,完美融合进 ElevenAgents —— 我们一体化的对话式ElevenAgents.

Eleven v3 对话式

Eleven v3 Conversational 是我们迄今为止最具情感理解力、最懂语境的 TTS 模型,能跨轮次保持对话上下文,语音表达意图、情感和重点,自然流畅,不生硬、不夸张。

例如,当用户表现出担忧时,可以引导智能体用更平和、安抚的语气;需要高效清晰时,则用更直接的语气。这些控制帮助团队让表达方式与品牌和用户预期保持一致。

全新轮流说话系统

人类对话不仅靠内容,更靠时机。打断太早会破坏信任,回应太晚则错失时机。

我们的新轮流说话系统基于行业领先的实时转写模型Scribe v2 Realtime,通过实时信号判断说话方式中的情感,更好地决定智能体何时说话、暂停或等待,让回应更贴近真人,尤其在情绪激烈时。

说话速度突然加快、音量升高并重复,通常意味着强烈压力或恐慌:

相反,语调明亮上扬、短促感叹,往往代表愉快的惊喜或松了一口气:

专为全球客户服务打造

Expressive Mode 支持 70 多种语言,细腻表达情感,提升了如印地语等以往表现欠佳的语言和方言的语音效果。

听听智能体用多种印度语言说话:

 / 

还有带阿根廷口音的西班牙语:

 / 

立即体验 Expressive Mode

部署具备情感表达的智能体,保持品牌一致,及时响应,适应真实客户情绪,让客户感受到帮助,而不是被流程化处理。

在 ElevenAgents 内为生产环境打造,具备大规模客户服务所需的可靠性、集成、测试和监控能力,支持从试点到全球部署。

立即体验:在线演示

查看文档:文档

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作