
ElevenLabs 推出全新生成式语音 AI 产品,并宣布完成 1,900 万美元 A 轮融资,领投方包括 Nat Friedman、Daniel Gross 和 Andreessen Horowitz
- 分类
- 公司
- 日期
1 月 22 日 / 全球 - ElevenLabs,一家语音技术研究公司,已完成 8,000 万美元 B 轮融资,由 Andreessen Horowitz, 、Nat Friedman, 、Daniel Gross 联合领投,红杉资本, 、SV Angel, 、Smash Capital, 、BroadLight Capital 和 Credo Ventures 参与,进一步巩固其在全球语音 AI 研究和产品落地领域的领导地位。
自公开发布以来,ElevenLabs 一直引领自然语音合成领域,支持用户在多种语言和口音下创建和设计 AI 语音,可呈现丰富情感和语调。自上线以来,ElevenLabs 用户已生成超过 100 年 的音频,公司团队也从 5 人扩展到 40 人。目前,ElevenLabs 技术已被 41% 的财富 500 强 企业员工使用。
ElevenLabs 技术已被广泛应用于多个行业,助力创作者通过旁白配音和 AI 配音提升受众体验,拓展教育可及性,并为有声书出版、娱乐和个人使用等场景提供创新解决方案,包括提升无障碍体验。本轮融资将用于进一步完善产品,并确保 AI 技术的安全应用。
除本次 B 轮融资外,ElevenLabs 还将于未来几周上线多项新产品:
2023 年,ElevenLabs 还拓展了在出版、游戏、媒体和对话等多个领域的影响力,并与多家主流媒体机构建立了 B2B 合作,包括:
这些新产品和合作伙伴关系,延续了 ElevenLabs 持续扩展自研工具套件的步伐。此前已发布:语音合成,实现逼真的 文本转语音,并推出了针对延迟优化的 Turbo 模型;声音设计 和 语音克隆,用于定制专属音色;语音转语音,可将一种声音转换为另一种。公司还推出了行业领先的 AI 配音 工具,支持自动将音频和视频翻译为 29 种语言,同时保留原说话人的音色和情感。 公司还将扩展 Turbo 和语音转语音模型,目前已支持英语,未来将覆盖更多语言。
基于这些功能背后的研究,ElevenLabs 还开发了适用于更复杂工作流的高级工具,如 工作室(用于出版)和 配音工作室(用于视频本地化)。工作室 帮助出版方高效编辑、组织、浏览和生成长内容,配音工作室 则通过对字幕、翻译和时间序列的精细控制,助力内容面向全球受众。
公司还推出了面向社区的产品,如 声音库 —— 一个分享 AI 生成声音的环境。此前仅支持分享通过声音设计工具创建的人工声音,现在声音库已支持用户通过专业语音克隆生成并验证个人声音副本,并在新上线的 声音库 市场中分享和获利。为保障市场安全和合规,ElevenLabs 采用专业语音克隆技术生成高保真声音副本。用户在分享声音前,需在限定时间内朗读文本提示,通过语音验证码验证声音与训练样本一致。该流程结合团队审核,确保分享和变现的声音真实可靠,为用户打造更安全可信的环境。
ElevenLabs 始终将 AI 的安全和负责任发展作为核心目标,重点推动检测能力,确保所有 AI 生成内容均可被清晰识别。公司去年推出了 AI 语音检测器,可验证音频样本是否包含 ElevenLabs 生成内容。今年将进一步提升检测器能力,覆盖更多语音 AI 模型,并与其他分发平台合作,推动更广泛应用。ElevenLabs 还在积极开发更多安全措施,提升公共领域的安全性。
本轮 B 轮融资后,ElevenLabs 将进一步巩固其在全球语音 AI 研究和产品落地领域的领导地位。资金将用于推进研究、扩展基础设施、开发面向特定行业的新产品,并加强安全措施,确保 AI 技术负责任和合规发展。
ElevenLabs CTO Piotr Dąbkowski 表示:
“团队的专注已在语音 AI 领域产生深远影响。这笔新资金让我们能够迎接更大挑战,持续保持在研究和产品开发上的领先优势。”
Mati Staniszewski 总结道:
“我们的目标始终如一——打破语言和沟通壁垒,改变内容互动方式。我们正在打造前沿技术,让内容跨语言、跨音色无障碍流通,让每个人都能获取重要的信息和故事。取得的进展离不开团队和投资人的支持,虽然这只是起点,但我们正共同推动无障碍和沟通的未来。”