Storytel、ElevenLabs搭載のボイスチェンジャーでオーディオブックのナレーションを再発明
- 公開日
- 最終更新日
聴くこの記事を聴く
Storytelはスウェーデン、デンマーク、フィンランド、ノルウェーを中心とした世界最大級のオーディオブック配信・出版企業です。ElevenLabsはStorytelと協力し、リスナーがオリジナルの人間ナレーターとAIナレーション版を選べるボイスチェンジャー機能を開発しました。
リスナーが長年抱えていた課題
Storytelのユーザーデータによると、10人中9人のお客様がオーディオブックを途中でやめてしまう理由は、本の内容ではなく、ナレーターの声に共感できないからでした。同時に、
このギャップを埋めるためにボイスチェンジャーが開発されました。
StorytelがElevenLabsを選んだ理由
StorytelはElevenLabsと提携する前からAI音声の研究を続けていました。2023年にElevenLabsの初期デモを見た際、それまで評価してきたものよりも明らかに高品質だったため、協業が始まりました。
「クオリティの高さに驚きました。以前から
— Johan Ståhle(Storytel チーフプロダクト&テクノロジーオフィサー)
北欧言語向けのカスタムモデル
英語音声は十分な品質だったため、2023年夏にボイスチェンジャーのパイロットを実施できましたが、スウェーデン語音声はフルオーディオブックに必要なレベルには達していませんでした。ElevenLabsはStorytelと協力し、Storytelが世界最大級のオーディオブック出版社として保有する高品質な独自音声データを活用し、北欧言語向けの改良モデルを開発しました。
改良された北欧モデルは2023年末に完成しました。
ローンチと北欧での展開
ボイスチェンジャーは2024年初頭にスウェーデンでローンチされ、スウェーデンで人気のナレーターのプロフェッショナルボイスクローンがアンバサダーとして機能を紹介しました。当時、長尺かつ高品質なAIオーディオブック作品はほとんどなく、StorytelとElevenLabsはこの分野で先駆けとなりました。
その後、ボイスチェンジャーはデンマークやフィンランドでも現地言語のアンバサダーボイスとともに展開されています。Storytelは今後も人間ナレーションとAIナレーションをカタログ内で拡大していく予定です。
完全自動化された制作体制への拡大
StorytelはElevenAPIを使ってボイスチェンジャーのナレーションを制作し、社内で前処理・後処理を加えています。発音辞書や固有名詞の事前生成、キャラクター名のチェックなどで、最終レンダリング前の品質を高めています。
Storytelの長期目標は、ボイスチェンジャーを全カタログで利用可能にすることです。その実現には現在必要な手動編集の削減が不可欠であり、ElevenLabsはStorytelと共に、API主導の完全自動化・大規模制作を目指して取り組んでいます。




