
ElevenLabs、200万ドルを調達し、オーディオストーリーテリングを革新するAIスピーチプラットフォームを発表
クリエイターや出版社が長編コンテンツをナレーションできるように設計されたベータプラットフォームへのアクセスを開放
- ElevenLabs、クリエイターや出版社が長編コンテンツをナレーションできるベータ版プラットフォームを開始
- プレシード資金調達ラウンドはCredo Venturesが主導し、Concept Venturesや個人投資家も参加
- 資金は今年後半にリリース予定のAI吹き替えの研究開発に充てられる
2023-01-23, ロンドン, 英国 | ElevenLabsは、AI音声技術のスタートアップで、長期的には音声を瞬時に異なる言語に変換することを目指しています。本日、Credo Venturesが主導し、Concept Venturesや他の個人投資家も参加したプレシード資金調達ラウンドで200万ドルを調達し、ベータ版プラットフォームを開始したと発表しました。
このプラットフォームは、クリエイターや出版社が長編コンテンツをナレーションし、オーディオ形式に展開することを可能にします。機能は、社内で開発された音声合成のディープラーニングモデルによって支えられており、人間のイントネーションや抑揚をリアルに再現し、文脈に応じて調整できます。ElevenLabsは、ボイスクローンや合成音声のデザインのためのツールも提供しており、ユーザーに新しい創造的な手段を提供することを目指しています。現在、選ばれた出版社と協力して、プラットフォームに2月初旬に追加されるボイスオーバー編集用の専用ワークステーションを開発中です。ElevenLabsは、ニュースやオーディオブックの大規模な音声化に必要な品質を提供する初のAIナレーターになることを目指しています。
能力の飛躍には革新が必要であり、ElevenLabsはまず第一に研究会社であると考えています。これまでの研究の多くは、新しいテキスト読み上げモデルの開発に焦点を当てており、高圧縮と文脈理解に依存して人間の音声を超リアルに再現します。また、トレーニングなしで高い出力類似性を達成する新しいボイスクローンモデルも構築しました。サンプルは5秒程度で、これまでにない成果です。デベロッパーはAPIを通じてこれらの機能にアクセスできます。
この研究はプラットフォームの現在の機能を支えるだけでなく、音声を瞬時に異なる言語に変換するという会社の究極の目標の実現にも貢献しています。今年後半にリリース予定のAI吹き替えツールは、ユーザーが任意の音声やビデオを異なる言語で自動的に再音声化し、元の話者の声を保持します。ElevenLabsは、初めに教育分野のクライアントを引き付けることを希望しており、長期的にはストリーミング、オーディオブック、ゲーム、映画、さらにはリアルタイムの会話において、オンデマンドの多言語オーディオサポートを実現することを目指しています。
音声合成と吹き替えツールは、補完的でありながらタイミングも絶妙です。どちらもオーディオとビデオをより広いオーディエンスに届けることを約束し、オーディオ分野が急成長している時期に登場します。初期のテスターグループには、YouTubeクリエイター、出版社、デベロッパーが含まれており、すでに毎日プラットフォームを使用してビデオ、ストーリー、キャラクターに声を当てています。生成音声の潜在的な応用範囲はさらに広がると予想されています。ニュース出版社は、オーディオプレゼンスを拡大することが購読者の関与と保持に優れた方法であることをすでに発見しています。しかし、ボイスアクターを契約するのは高価であり、記者が自分のストーリーを読むのも同様です。書籍やニュースレターの著者、さらにはゲームデベロッパーも同様の課題に直面しています。前者はますます自分の作品をナレーションするようになり、後者は特定のキャラクターが録音コストに見合うかどうかを判断する必要があります。既存のテキスト読み上げソフトウェアを使用する人々は、コストを節約しますが、品質を妥協するという別の代償を払っています。ElevenLabsは、もはや妥協する必要はないと主張し、クリエイターや出版社に最も先進的で多用途なAIストーリーテリングツールを提供する準備を進めています。
「今回立ち上げるプラットフォームは、テキストを高品質な音声に変えることに特化しています。声を持てなかったすべての著者、クリエイター、デベロッパーに声を与えることで、人々が好きな本やニュースレターを楽しめるようにしたい」- と共同創設者のMati Staniszewskiは言います。「私たちの究極の目標は、人々が自分にとって関連性があり興味深いコンテンツを、話す言語に関係なく楽しめるようにすることです」 -と、共同創設者のPiotr Dabkowskiも付け加えます。
Credo Venturesでは、CEE地域の賢く野心的な創業者と協力することを目指しています。最初の会議で、MatiとPiotrの目に飢えと火花を見ました。数ヶ月後、彼らはOpenAIクラスの音声技術研究拠点となり、人工オーディオの最大の課題を克服しています。彼らの合成音声はすでに本物と区別がつかず、このブレークスルーは、これまでにない品質と忠実度でコンテンツを生成するための障壁を大幅に下げただけでなく、すぐに多言語化によってクリエイターがオーディエンスを大幅に拡大できるようにします。– とCredo Venturesのジェネラルパートナー、Maciek Gnutekは言います。
エンターテインメントやビジネスの世界で一般的であるにもかかわらず、オーディオは最近の研究の進展から比較的無視されてきました。生成AIの黄金時代において、MatiとPiotrを支援できることにこれ以上ない興奮を感じており、ElevenLabsがこの技術を大衆に届けるチームであると信じています。 - とConcept Venturesのプリンシパル、Oliver Kicksは言います。
ElevenLabsについて:
ElevenLabsは、クリエイターや出版社向けにAI音声合成ソフトウェアを開発する研究会社です。同社のツールは非常にリアルな音声を再現し、文脈やユーザーの指示に基づいてイントネーションや抑揚を調整できます。同社のプラットフォームは、ニュース、ニュースレター、書籍、ビデオの音声化に必要な品質と多様性を提供するワンストップショップを目指しています。主な機能には、テキストベースの音声生成、ボイスクローン、ボイスデザイン、そして近々ナレーション編集のためのプロジェクトワークフローが含まれます。ElevenLabsは、元Googleの機械学習エンジニアであるPiotrと、元PalantirのデプロイメントストラテジストであるMatiによって2022年に設立されました。同社の長期的な目標は、話されるコンテンツをあらゆる言語と声で普遍的にアクセス可能にすることです。
ベンチャーキャピタル提供者 Credo Ventures と Concept Ventures。個人投資家には、Peter Czaban、Tytus Cytowski、Talfan Evans、Dr Fatima Godall、Tomasz Karwatka、Piotr Karwatka、Akhil Paul、Bartek Pucek、Marta Pyrzyk、Carles Reina、Parin Shah、Charlie Songhurst、Harry Songhurstが含まれます。
お問い合わせ
press@elevenlabs.io
もっと見る


Dubbing made simpler, sharper, and faster at PERSO.ai
ESTsoft and ElevenLabs partner to bring natural voiceovers and frame-accurate lip-sync to global video localization.