
3Shape 与 ElevenLabs 宣布在对话式 AI 领域展开合作
- 分类
- 资源
- 日期
英国伦敦– ElevenLabs,全球领先的 AI 语音软件提供商,今日发布了全新多语种语音生成模型,可在 30 种语言中生成“富有情感”的 AI 音频。
该模型完全基于自研技术,开发者可用它为欧洲、亚洲和中东等国际市场制作本地化音频内容。过去 18 个月,ElevenLabs 分析了人类语言的关键特征,开发了理解上下文和表达情感的新机制,并合成了独特的新声音。
通过 Eleven Multilingual v2 新模型在 ElevenLabs 文本转语音平台输入文本时,几乎可自动识别 30 种书写语言,并以前所未有的真实度生成这些语言的语音。
无论使用合成声音还是克隆声音,发音人的独特音色特征和原有口音都能在所有语言中保留。这意味着同一个声音可以演绎 30 种不同语言的内容。
此次 发布 紧随专业语音克隆功能面向所有创作者开放。此次产品更新还带来了更多安全功能,用户可创建自己声音的完美数字副本,
几乎与原声无异。现在,声音可在近 30 种多语种模型支持的语言中使用。
支持的语言包括:韩语、荷兰语、土耳其语、瑞典语、印尼语、越南语、菲律宾语、乌克兰语、希腊语、捷克语、芬兰语、罗马尼亚语、丹麦语、保加利亚语、马来语、匈牙利语、挪威语、斯洛伐克语、克罗地亚语、阿拉伯语和泰米尔语。这些语言补充了已支持的英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语。
随着新功能上线和平台持续优化,ElevenLabs 今日也宣布平台已正式结束 Beta 阶段。这一转变标志着公司致力于为全球超 100 万用户提供可靠、先进工具的重要时刻。
未来,ElevenLabs 计划推出新机制,让用户可以在平台上分享声音,并通过新音频数据的开发获益,进一步促进人与 AI 的协作。
ElevenLabs CEO 兼创始人 Mati Staniszewski 表示:
“ElevenLabs 的初衷是让所有内容在任何语言、任何声音下都能被全球用户访问。Eleven Multilingual v2 的发布让我们更进一步,让高质量 AI 声音覆盖每种方言。
我们的语音合成工具为所有创作者提供高质量的语音合成选择,这些优势现在已扩展到近 30 种语言的多语场景。我们希望未来借助 AI 覆盖更多语言和声音,消除内容的语言障碍。ElevenLabs 相信,这些可访问性的提升最终会带来更多创造力、创新和多样性。”
ElevenLabs 降低了多语言高质量音频内容制作所需的成本和资源。企业和创作者可以更高效地制作跨越文化和语言边界的内容。
独立游戏开发者和发行商 可借助多语种语音生成工具,将游戏体验和音频内容翻译给国际用户,与玩家和听众用他们的母语交流,无需在语音质量或准确性上妥协。
同样,教育机构现在也能为学习者即时提供目标语言的精准音频内容,提升语言理解和发音,满足国际学生多样的教学和学习需求。
各类创作者都可利用 ElevenLabs 工具,提升内容可访问性,让视障人士或有特殊学习需求的人群也能通过多语种语音获取视觉内容。
2023 年 1 月发布的首批 AI 语音工具,可将任意文本转为语音,支持多种预设合成声音,也可克隆个人声音。多语种语音合成工具是 ElevenLabs 推动所有内容在任何语言、任何声音下都能被访问的重要一步。
这项技术已在众多创意行业和领域应用。它让独立作者创作有声书、为游戏配角配音、帮助视障人士获取在线文本内容,甚至支持全球首个 AI 电台。ElevenLabs 还与多家领先内容创作者和工作室合作,包括 AI 视频生成器D-ID, Storytel,全球最大有声书出版商之一,开放获取视频平台ScienceCast,其视频生成工具聚合了arXiv 发布的科研论文,全球领先的内容创作平台TheSoul Publishing,以及知名游戏开发商Embark Studios和Paradox Interactive还有媒体平台MNTN。
