Studioの紹介: 高品質なオーディオブックを数分で作成

2023年9月19日 • 3 分で読めます

長編オーディオ作成のワンストップソリューション

A recording studio with a microphone, headphones, a smartphone, a notebook, and a coffee cup on a wooden desk.

本日、長編オーディオの生成と編集のための高度なワークフローであるStudioを発表します。Studioは、長編音声合成、オーディオコンディショニング、並列オーディオ生成の研究の集大成として、クリエイター、出版社、独立した著者が対話セグメント、ニュース記事、さらにはAIオーディオブックを数分で声にすることを可能にします。すべてが一つのワークフロー内で完結します。

Studioは音声合成、VoiceLabと共に、独自のツールとして長編オーディオ作成のワンストップソリューションを提供します。また、Voice Library as a tool in its own right; a one-stop solution for long-form audio creation. It also comes fully integrated with プロフェッショナルボイスクローン、ボイスライブラリー、そして多言語モデルと完全に統合されています。

STUDIO（スタジオ）

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

ビデオとオーディオの編集、ボイスオーバーと音楽の追加、テキストへの書き起こし、ナレーション付きの字幕付き作品の公開までの完全なワークフロー

ユーザーからの長編オーディオ生成の需要がかつてないほど高まっています。

このリリース前、ユーザーは多くの課題に直面していました。長いコンテンツを生成する際の安定性の問題やフローの中断に悩まされていました。異なる話者によって話されたテキスト断片をつなぎ合わせる際に、明らかな不連続性がありました。声の切り替えがスムーズでなく、連続した対話を作成するのが難しかったのです。短い部分に欠陥があっても、全体のオーディオ断片を再生成するのは不便で非効率的でした。また、特定のテキストファイル形式に制限され、プラットフォーム内で作業する前に変換が必要でした。

Studioでは、ボタンをクリックするだけでAIオーディオブック全体を生成できます。特定のテキスト断片を特定の話者に割り当てることで、物語に命を吹き込むことができます。テキストセグメント間のポーズの長さを調整して、ペースをよりコントロールすることも可能です。さらに、選択的なオーディオ再生成機能を導入しました。大きなテキスト断片の一部を再生成する際に、全体をやり直す必要はありません。これらの断片は周囲のオーディオのリズムとイントネーションに自動的に一致します。保存と再開の機能も追加されました。最後に、Studioは.epub、.pdf、.txtファイルのインポートをサポートし、URLからプロジェクトを開始することもできます。

始め方

Studioの操作は簡単で直感的です。

トップバーメニューからStudioを選択します。
新しいプロジェクトを作成をクリックします。
プロジェクトの初期化方法を選択します。
テキストの作成を開始します。
プロジェクト全体を一度にレンダリングするには変換をクリックするか、特定の断片をテストするには再生と再生成を使用します。

Narrative

00:00 / 00:00

機能のハイライト

Studioは、Googleドキュメントを使用するようなシンプルなユーザー体験を提供し、直感的でユーザー中心のインターフェースがさまざまな編集機能をサポートします。

完全変換: プロジェクト全体を一度にレンダリングするには単一のボタンを使用するか、特定の断片をテストするには再生と再生成を使用します。
話者の割り当て: 異なるテキスト断片をさまざまな話者に割り当て、見出しや段落のデフォルトの声を選択します。
オーディオ断片の再生成: 大きなオーディオ断片内の特定のセグメントをシームレスに再生成し、コンテキストを保持します。
ポーズの挿入 (今週後半に登場): スピーチセグメント間のポーズの長さを手動で調整し、ペースを微調整します（初期は最大3秒）。
章ごとのセグメント化: 特定の断片に集中するためにテキストをセクションに構造化します。
進行状況の保存と再開: 作業を一時停止し、すぐに再開できる便利な機能。
ファイルのインポート: Studioは.epub、.pdf、.txtファイルをサポートし、よりスムーズなワークフローのためにURLもサポートします。
インテリジェントな再生成: 既に生成されたプロジェクトで作業を再開する際、変更された断片の再生成にのみ課金され、プロジェクト全体には課金されません。

互換性

Studioは、音声合成、VoiceLab、ボイスライブラリーと共に、長編オーディオ合成の包括的なソリューションとして機能します。さらに、プロフェッショナルボイスクローン、ボイスライブラリー、多言語モデルとシームレスに統合されています。

プロフェッショナルボイスクローン: 自分の声で長編オーディオコンテンツを生成します。ボイスライブラリーを通じてプロのボイスクローンを共有し、他の人があなたの声を使ってプロジェクトを作成する際にキャラクター報酬を得ることができます。
ボイスライブラリー: コミュニティが作成した無数の声から、物語に最適な声を選びます。完璧なストーリーテラーの声を選んで、ロマンチックな物語や、壮大な冒険、または未来的なSFオーディオブックに最適です。サンタクロース、ラジオDJ、スポーツアナウンサー、ニュースキャスター、またはカスタマーサービスエージェントなど、さまざまなキャラクターを紹介します。customer service agents.
Eleven多言語: 既成の声、クローン声、または自分の声を選んで、当社の多言語モデルがサポートするすべての言語をシームレスに話すことができます。

Studioは本日利用可能です

Studioの目標は、長編オーディオ生成をできるだけ簡単にするツールを設計することでした。新しい研究と皆様からのフィードバックを基に、既存のツールエコシステムとシームレスに統合された包括的なソリューションを開発しました。皆様の物語がどのように命を吹き込まれるか、楽しみにしています！自分のオーディオブックを作成したいですか？AIオーディオブックツールでAIナレーターを作成してください。

STUDIO（スタジオ）

更新: 2025年1月より、ProjectsはStudioと呼ばれ、すべての無料ユーザーが利用可能です。

ElevenLabsチームによる記事をもっと見る

Creative Platform Stories

Pickford creates real-time interactive cinema experiences with ElevenLabs

Elevating audience-driven storytelling through AI voice

Agents Platform Stories

Agents Platform Stories

BLACKBOX chooses ElevenLabs Agents over OpenAI to power Logger and Robocoder

Delivering more natural conversations, broader voice coverage, and scalable deployment for over 30 million developers.

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか？ログイン