AIを使って全世界のオーディオブックリスナーにパーソナライズされたナレーションを提供する方法

人工知能は、すべてのオーディオブックリスナーが自分の言語とアクセントでパーソナライズされたナレーションを持つことを可能にします。

お気に入りの本の続編を心待ちにしている自分を想像してみてください。ついに、数ヶ月の後に、これがやってきました。オーディオブックをダウンロードし、再生ボタンを押します。あなたの心の中で、ナレーターは温かみのあるざらざらとした声を持っていると想像していた。少し高級感のあるイギリスのアクセントを感じさせるかもしれない。しかし代わりに、その声は平坦だったり、あまりにも高音だったり、あるいはただ単に違っている。

物理的な本では、可能性は無限大です:あなたの心がキャラクターの声を形作ります。従来のオーディオブックでは、その選択はあなたのために行われます。数十年にわたり、オーディオブックは出版社の判断や予算の制約、ナレーターの都合によって、一つの声に限定されていました。しかし、AIはそれを変えています。今日では、ただ受動的に聞くだけでなく、自分の選んだ方法で本に積極的に関わることができます。

この変化は重要です。なぜなら、オーディオブック市場は前例のない速度で成長しているからです。2029年までに、オーディオブックのリスナー数は18億人に達すると予想されています。世界の収益も増加しており、2025年末までに98.4億ドルに達し、2029年までに130億ドルを超えると予測されています。

これらの成長にもかかわらず、現在の市場の数字は主に従来のオーディオブック制作を反映しており、それらはコストやナレーターの可用性によって依然として制限されています。私たちは、音声AIが制作の障壁を減らすことでこの成長を加速させ、オーディオブックを言語や地域を超えてよりアクセスしやすくし、より多くのクリエイターが自分の物語を形にできるようになると考えています。 

没入感があり便利なストーリーテリングの需要が高まり続ける中、AIによるナレーションがオーディオブック市場の潜在能力を最大限に引き出す役割を果たすでしょう。

一つの声を超えてAIによるパーソナライズ

ElevenLabs Reader App

1つのアプリで、あらゆる書籍、記事、PDF、ニュースレター、テキストを超リアルなAIナレーションで生き生きと表現

伝統的なオーディオブックは長い間、出版社によって選ばれた一人のナレーターに制限されており、その選定はしばしば予算、著者の意見、ナレーターのスケジュールに基づいていて、リスナーの好みにはあまり考慮されていませんでした。英語のオーディオブックはアメリカの声を特徴とするかもしれませんが、オーストラリア人やインド人のリスナーは、より親しみのあるアクセントのナレーターを好むかもしれません。

物理的な本を読むのとは異なり、読者は自然にキャラクターの声を想像しますが、従来のオーディオブックはその柔軟性を提供しませんでした。ニューヨーク・タイムズのベストセラー作家として ジョセフ・ナッシス は指摘します:

みんな違うんだ。著者として私が好むものや想像するものは、リスナーが実際に好むものとは異なるかもしれない。リスナーにストーリーの語り方を選ぶ柔軟性を与えることは、非常にパワフルなことだ。

AI駆動のナレーションは、ユーザーがリスニング体験をカスタマイズできるようにすることで、オーディオブックをより没入感があり、アクセスしやすくします。

個人的な好みを超えて、AIナレーションは著者、特にインディー作家や小規模市場の作家が直面する障壁を取り除きます。人間のナレーションのコストと制作時間は伝統的に高く、自己の作品をナレーションしたい著者でさえ、常に選ばれるわけではありません。

USA Todayのベストセラー作家として リーアナ・モーガン は述べています:

まさに初めて、読者はオーディオブックをどのように聞きたいかを自分で選ぶことができるのです。ElevenReader アプリは、リスナーが自分のオーディオブック体験をカスタマイズし、著者の物語を自分にとって最も意味のある形で生き生きとさせることを可能にするでしょう。

この ElevenReaderアプリ は、すでに32以上の言語で数十万人のユーザーが好みのAI音声を選択できるようにしており、声優にも報酬が支払われ、昨年だけで100万ドル以上の収益が支払われました。

従来のオーディオブック制作において、言語の選択も大きな制約となっており、ほとんどの録音は世界的に支配的な言語に限られています。翻訳が存在しても、ローカライズされたアクセントや方言はほとんど考慮されません。

ElevenLabsの音声技術は、文脈を理解した非常にローカライズされた声を生成することでこれを変えます。ナレーションが自然で感情的に共鳴するようにします。私たちの90万時間近くのオーディオブックリスニングからのデータは、ユーザーがローカライズされた声を強く好むことを示しています。 

ElevenLabsリーダーアプリの8つの主要な世界言語では、34以上のユニークなAI音声が用意されており、特定の言語で最も人気のある声は、全体のリスニングのわずか15%を占めています。

この多様性は、各リスナーにとって自然に感じられるナレーションへの需要を浮き彫りにしています。同じ言語の中でさえも、好みは大きく異なります。

Brian

 / 

George

 / 

例えば、英語では、アメリカではブライアン(アメリカのアクセント)が最も選ばれ、イギリスやオーストラリアではジョージ(イギリスのアクセント)が好まれています。ポルトガル語でも同様の傾向が見られます。ブラジルではジェシカが最も人気のある声ですが、ヨーロッパポルトガル語のリスナーはデイビッドを好みます。

Jessica

 / 

David

 / 

データによると、ポルトガルとブラジルは同じ言語のルーツを持ちながらも、トップ5の中で共通していたAI音声は1つだけでした。これは地域の多様性の重要性を示しています。この方言の好みは直感的に理解できるものですが、声のトーンはさらに主観的です。

グラスゴーを舞台にしたスリラーは、グラスウェイジャンのアクセントで聞くのが一番良いかもしれません。一方、パリのラブストーリーはフランス語のアクセントで聞く方が自然に感じられます。

私たちの90万時間近くのオーディオブックリスニングの分析は、すべてのリスナーに合う単一の声は存在しないことを確認しています。一つの言語内でも、AI音声にはユーザーの好みの「ロングテール」が見られます。つまり、サンプル内で最も人気のあるナレーターはリスニングのわずか10%を占め、50%の使用率に達するには12以上の声が必要です。

これは、従来のオーディオブック制作が到底対応できない現実を裏付けています: 世界中のリスナーは選択肢を求めており、AIがそれを可能にします。

もっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちの方 ログイン