
ElevenLabs vs. Cartesia (June 2025)
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Eleven v3 アルファのご紹介
v3を試す先月、私たちは発表しました、音声生成のための生成モデルが登場すると。それがついに完成し、初の試みとなるこのモデルをVoice Designと呼んでいます。この機能では、性別、年齢、アクセントなどの基本特性を選んで新しい声をゼロから作成できます。同じ基本設定でも、生成ボタンを押すたびにランダム性が加わり、聞くたびに全く異なる声が生まれます。ボイスデザインは、出版社やクリエイターに最も多様なAIストーリーテリングツールを提供するための取り組みの一環です。
ボイスデザインの背後にあるモデルは、音声合成とボイスクローンの研究の成果です。独立して、音声の生成ツールのアイデアを常に好んでいました。生成テキストから画像やチャットボットモデルの実用的な応用はすでに見られますが、オーディオ用の同様のツールはありませんでした。私たちのローンチ以来、スピーカーをもっと追加してほしいというリクエストが寄せられています。無数の声でライブラリを埋め尽くし、誰が誰かを知るために各プレビューを聞かせるのではなく、スピーカーのアイデンティティを決定し、その制約内で無限のバリエーションを可能にすることにしました。
音声選択にコントロールを加えることは重要でした。ユーザーはしばしばスクリプトに具体的な音声特性を求めるからです。生成された各音声がユニークであることを保証することも同様に重要でした。多くのユースケースでは、独占的な音声アクセスが必要、または有益だからです。ユーザーに新しい創造的な手段を提供することに加え、ボイスデザインで生成された声は完全に人工的で、実在の人物には属しません。
私たちの定番である音声合成ツールで、文章を高品質なオーディオに簡単に変換できるだけでなく、書籍の著者は、ボイスデザインを使ってナレーションに芸術的なコントロールを加え、キャラクターごとに独自の声を作り出すことができます。
ニュース出版社がオーディオに進出する際、物語に声が必要です。ナレーターは代表する出版物と結びつくため、適切なボイスオーバーを選ぶことは重要で、頻繁に繰り返されることはありません。ボイスデザインは、出版社が無数のナレーターをその場で選んで比較することを可能にします。また、特定の声が彼らだけを代表するという安心感を提供します。
ゲームデベロッパーは、特定のキャラクターが録音コストに見合うかどうかを選ぶ必要がなくなりました。何万もの以前は無口だったNPCが、今ではユニークな個性を持ち、仮想の没入感の限界を押し広げます。
あなたがコンテンツクリエイターとして次のリリースに取り組んでいる場合でも、企業の役員として会社のコミュニケーションに声を与えたい場合でも、特定のユースケースやオーディエンスに対してリアルで魅力的なオーディオをデザインする可能性は無限大です。
ボイスデザインは、今年導入予定のナレーション編集機能の一つです。次はStudioです。大規模なテキストを構造化し、ポーズを挿入し、オーディオの一部を再生成し、異なるスピーカーにテキストの部分を割り当てるための新しいワークステーションです。Studioは3月下旬に登場し、今年の第2四半期にはイントネーション編集サポートが追加されます。
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Unlocking the Power of AI Voiceovers for eLearning