
Graydon Carter’s Air Mail, now in audio
We’re adding audio to Air Mail magazine, so readers can follow it anywhere
この11月、私たちは初めて音声合成プラットフォームを立ち上げます。これにより、出版社やクリエイターは高品質で感情豊かな長編コンテンツを生成できます。
この方向性を選んだ理由はいくつかあります。現在、ニュースやオーディオブックに適した高品質の長編音声を生成できるツールはありません。私たちのチームはオーディオに関するすべてのものを熱心に聴いており、長編コンテンツの課題に取り組むことが私たちの野望を実現する自然なステップだと感じました。また、これを私たちの際立った機能と考えることに特に興奮しています。私たちは、最も感情豊かでリアルな声をクリエイターや出版社に提供する最初のAI音声技術プラットフォームです。
このため、私たちのプラットフォームでは、ニュース記事、本、ニュースレター、ブログ、学術論文など、あらゆるテキストから高品質でボイスアクター級の音声を生成し、ダウンロードできます。あらかじめ定義された合成音声から選ぶか、提供されたサンプルから声をクローンすることができます。私たちの技術の用途は無限です。既存のコンテンツにクロスメディアのアクセシビリティを提供することから、生産性を向上させ、過去のテキストをオーディオに変換して復活させたり、新しいコンテンツを作成したりすることまで。次の目標は他の言語へのサポート拡大です。
これを実現する方法は、私たちのモデルの構築方法にあります。モデルは何が言われているかを理解し、それに応じて配信を調整するように訓練されています。これは、単語の意味だけでなく、各発話の周囲の文脈も考慮に入れることで実現します。
従来の音声生成アルゴリズムは、文ごとに発話を生成します。これは計算負荷が少ないですが、すぐにロボットのように感じられます。感情やイントネーションは、特定の思考をまとめるために複数の文にわたって伸びて共鳴する必要があります。トーンとペースは意図を伝え、これが音声を人間らしく聞こえさせる要素です。したがって、各発話を個別に生成するのではなく、モデルは周囲の文脈を考慮し、生成された全体の素材にわたって適切な流れとプロソディを維持します。この感情的な深みと最高の音質が組み合わさり、ユーザーに最も本物で魅力的なナレーションツールを提供します。
私たちのプラットフォームは来月公開されます。今日、ベータテスターとして登録できます。elevenlabs.io
私たちのソフトウェアがどのように動作するか興味がある方は、audiostory.aiへどうぞ。これはEleven Labsのサイドプロジェクトで、長編音声生成能力を紹介することを目的としています。過去のニュース記事や本を合成音声で読み上げます。最初のエピソードは、1899年のニューヨークタイムズの記事で、ラジオの発明についてです。これをこちらでお聴きください。また、まだの方は、このページの上部に移動して、このエントリーを音声でお聴きください。
We’re adding audio to Air Mail magazine, so readers can follow it anywhere
Startup Grants are now available for 12 months, with every recipient receiving 33 million free credits to use across our platform, equivalent to over 680 hours of Conversational AI audio. That’s a full year of free access to ElevenLabs’ AI audio, giving founders the runway to prototype, iterate, and scale.
Powered by ElevenLabs 会話型AI