コンテンツにスキップ

Storytel、ElevenLabs搭載のボイスチェンジャーでオーディオブックのナレーションを再発明

公開日
最終更新日

聴くこの記事を聴く

Storytelはスウェーデン、デンマーク、フィンランド、ノルウェーを中心とした世界最大級のオーディオブック配信・出版企業です。ElevenLabsはStorytelと協力し、リスナーがオリジナルの人間ナレーターとAIナレーション版を選べるボイスチェンジャー機能を開発しました。

リスナーが長年抱えていた課題

Storytelのユーザーデータによると、10人中9人のお客様がオーディオブックを途中でやめてしまう理由は、本の内容ではなく、ナレーターの声に共感できないからでした。同時に、

このギャップを埋めるためにボイスチェンジャーが開発されました。

StorytelがElevenLabsを選んだ理由

StorytelはElevenLabsと提携する前からAI音声の研究を続けていました。2023年にElevenLabsの初期デモを見た際、それまで評価してきたものよりも明らかに高品質だったため、協業が始まりました。

「クオリティの高さに驚きました。以前から

Johan Ståhle(Storytel チーフプロダクト&テクノロジーオフィサー)

北欧言語向けのカスタムモデル

英語音声は十分な品質だったため、2023年夏にボイスチェンジャーのパイロットを実施できましたが、スウェーデン語音声はフルオーディオブックに必要なレベルには達していませんでした。ElevenLabsはStorytelと協力し、Storytelが世界最大級のオーディオブック出版社として保有する高品質な独自音声データを活用し、北欧言語向けの改良モデルを開発しました。

改良された北欧モデルは2023年末に完成しました。

ローンチと北欧での展開

ボイスチェンジャーは2024年初頭にスウェーデンでローンチされ、スウェーデンで人気のナレーターのプロフェッショナルボイスクローンがアンバサダーとして機能を紹介しました。当時、長尺かつ高品質なAIオーディオブック作品はほとんどなく、StorytelとElevenLabsはこの分野で先駆けとなりました。

その後、ボイスチェンジャーはデンマークやフィンランドでも現地言語のアンバサダーボイスとともに展開されています。Storytelは今後も人間ナレーションとAIナレーションをカタログ内で拡大していく予定です。

完全自動化された制作体制への拡大

StorytelはElevenAPIを使ってボイスチェンジャーのナレーションを制作し、社内で前処理・後処理を加えています。発音辞書や固有名詞の事前生成、キャラクター名のチェックなどで、最終レンダリング前の品質を高めています。

Storytelの長期目標は、ボイスチェンジャーを全カタログで利用可能にすることです。その実現には現在必要な手動編集の削減が不可欠であり、ElevenLabsはStorytelと共に、API主導の完全自動化・大規模制作を目指して取り組んでいます。

関連記事

最高品質のAIオーディオで創造する