
有声书推广方法
- 分类
- 资源
- 日期
伦敦,英国 - ElevenLabs,全球领先的 AI 语音软件公司,今日发布了支持 30 种语言的多语言语音生成新模型,可精准生成“情感丰富”的 AI 语音音频。
这一突破完全基于内部研究,将帮助创作者为欧洲、亚洲和中东等国际市场制作本地化音频内容。过去 18 个月,ElevenLabs 深入分析了人类语音特征,开发出全新机制,能理解语境、传递情感,并合成独特新声音。
通过 Eleven Multilingual v2,在 ElevenLabs 的文本转语音平台输入文本,新模型可自动识别约 30 种语言,并生成前所未有真实感的语音。
无论使用合成声音还是克隆声音,发声者的独特音色在所有语言中都能保留,包括原有口音。也就是说,同一个声音可以为 30 种不同语言的内容配音。
本次 发布紧随 专业语音克隆功能上线,所有平台创作者均可使用。该产品升级还带来了更多安全功能,用户可创建与原声几乎无差别的数字分身。今天的发布意味着你的声音可以用近 30 种语言表达。
支持的语言包括 韩语、荷兰语、土耳其语、瑞典语、印尼语、越南语、菲律宾语、乌克兰语、希腊语、捷克语、芬兰语、罗马尼亚语、丹麦语、保加利亚语、马来语、匈牙利语、挪威语、斯洛伐克语、克罗地亚语、阿拉伯语和泰米尔语。此前已支持英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语。
随着新功能的持续发布和平台不断升级,ElevenLabs 今日也正式宣布平台结束 Beta 阶段。这一转变标志着公司为全球超 100 万用户持续提供可靠、前沿工具的重要时刻。
未来,ElevenLabs 计划上线声音分享机制,用户可在平台共享声音,并通过新音频内容获益,进一步促进人与 AI 的协作机会。
ElevenLabs CEO 兼联合创始人 Mati Staniszewski 表示:
“ElevenLabs 的初衷是让所有内容都能用任意语言、任意声音被每个人访问。Eleven Multilingual v2 的发布,让我们离这个目标又近了一步,也让 AI 生成的人类级声音覆盖所有方言。”
“我们的文本转语音工具助力机会平等,为所有创作者带来高质量语音能力。现在,这些优势已扩展到近 30 种语言的多语言应用。未来,我们希望借助 AI 支持更多语言和音色,消除内容的语言障碍。在 ElevenLabs,我们相信这些可访问性进步最终会激发更多创造力、创新和多样性。”
ElevenLabs 降低了多语言高质量音频内容的制作成本和资源门槛,让企业和创作者能用多种语言和文化,创作更具创意、可访问性的内容。
对于 独立游戏开发者和发行商,多语言语音生成工具为游戏体验和音频内容的本地化带来新机遇,让全球玩家和听众都能用母语体验,无需牺牲语音质量和准确性。
同样,教育机构 现在也能即时为学生提供精准、目标语言的音频内容,提升多语言理解和发音能力,同时满足不同教学风格和全球学生的学习需求。
任何创作者都可用 ElevenLabs 工具提升 内容可访问性,帮助视障或有特殊学习需求的人群,让视觉内容配合多语言音频呈现。
ElevenLabs 于 2023 年 1 月推出的首批 AI 语音工具,支持将任意文本转为语音,内置多种合成音色,并可克隆用户声音。多语言语音合成工具是 ElevenLabs 实现内容普及、任意语言任意声音访问目标的重要一步。
这项技术已被多个行业和创意领域采用,帮助独立作者制作有声书、为游戏角色配音、支持视障用户访问在线文字内容,甚至推动全球首个 AI 电台频道上线。ElevenLabs 已与多家顶级工作室和内容创作者合作,包括 AI 视频生成平台 D-ID,全球最大有声书发行商之一 Storytel,开放科学视频平台 ScienceCast,其视频生成工具可将科学论文浓缩为 arXiv,全球领先内容创作平台 TheSoul Publishing,以及多款知名游戏开发商,如 Embark Studios和 Paradox Interactive,以及媒体平台 MNTN。