ElevenLabs Agentsでカスタマーインタビューのプロセスをスケールした方法
- 公開日
聴くこの記事を聴く
私たちはElevenLabs Agentsを使って、230名以上のユーザーにElevenReaderアプリでインタビューしました。
この記事では、ボイスエージェントの構築方法、このテストの結果、そしてご自身のプロダクト改善にどう活用できるかをご紹介します。
スケールの課題
カスタマーインタビューは大切ですが、数を増やすのは難しいです。通常の15分間のライブインタビューは有益ですが、1日に何件もスケジュールするのは大変です。
カレンダーの調整は難しく、少人数のチームで世界中の多言語ユーザーをサポートするのはほぼ不可能です。24時間体制で深い会話を続けるのは物理的に限界があります。
アンケートはスケールしやすいですが、情報が失われがちです。フィードバックが選択肢にまとめられ、1対1の会話で得られる感情やニュアンスが抜け落ちます。ボイスAIやLLMの進化で、このギャップを埋められるようになりました。
ElevenLabs AgentsでAIインタビュアーを作り、ユーザーと実際に会話しながらフィードバックを集めました。24時間以内に230件以上のインタビューを実施し、得られたインサイトをもとにアプリの改善も行いました。
AIインタビュアーの作成
ElevenLabs Agentsのプラットフォームで会話型リサーチャーを作成しました。目的は、ElevenReaderアプリのユーザーがどう感じているかを、主に4つの観点から理解することでした:
- 機能要望と改善点
- 主な利用ケース
- 競合との比較
- 価格とブランド価値
フレンドリーで会話しやすい雰囲気を重視し、ボイス「Hope - The podcaster」を選びました。まるで共感力のあるリサーチャーと向かい合っているような感覚です。ロジックにはGemini 2.5 Flashを使い、低遅延と高い知能のバランスを取りました。
プロンプト設計とガードレール
エージェントが深掘り質問をしつつ、会話が脱線しないように指示するシステムプロンプトを作成しました。ユーザーが曖昧な返答や一言だけの回答をした場合は、より詳しいフィードバックを促すようにしました。リリース前には、ElevenLabsのシミュレーションテストで、曖昧な返答や不適切な言葉などのケースにも対応できるか確認しました。
こちらをご覧ください今回使用したシステムプロンプトです。

データ収集
ElevenLabs Agentsの分析機能を使い、各通話を評価しました。このツールは文字起こしから構造化データを抽出し、自由な会話を具体的なインサイトに変換できます。例えば、次のような質問への回答を自動で集計できました:
- 「今日、ElevenReaderを主にどのように使っていますか?」
- 「アプリを改善するなら2つ挙げてください」

エージェントは10分経過後にend_callツールで会話を終了し、ユーザーに丁寧にお礼を伝えました。
結果
24時間以内に、合計36時間以上の会話データを収集できました。
- 成功率: 85%の通話が成功し、話題も適切でした。
- エンゲージメント: 通話の中央値は10分(最大時間)でした。
- 深さ: 1回の会話で87メッセージに及んだものもあり、中央値は25メッセージでした。
- コスト: 1回10分の通話あたり1ドル未満(1分あたり9セント)で、すべてElevenLabs Agents

で実施しました。
データ分析
Claude Opus 4.5を使い、36時間分の文字起こしデータをUXリサーチの観点から分析しました。
モデルで大まかな傾向を抽出し、追加プロンプトでユーザーのセグメント分けやナビゲーションのフィードバック、地域ごとの価格感度など、より細かなインサイトも明らかにしました。

これらの結果を社内で共有するため、Claudeでインタラクティブな成果物を作成しました。チームは特定のデータポイントをクリックして、トレンドの根拠となったユーザーの発言を直接確認できます。
主な発見
ユーザーはAIとの会話に抵抗がなく、95%近くが会話型エージェントだと意識せずにインタビュアーとやり取りしていました。あるユーザーの声:

「このカスタマーサービスのインタビューは、今まで体験した中で最も印象的なAI体験です。すべてのアンケートがこうだったらいいのに、すべてのカスタマーサービスもこうだったらいいのにと思います。」
- わかったこと:ニーズのセグメント化:
- ElevenReaderのフィクション読者の21%が複数キャラクターの会話を要望しており、他のユーザー層よりも高い割合でした。ブランド価値:
- ユーザーはElevenReaderを「どこでも、どんな本でも、自然な音声で聴ける自由」と結びつけていました。言語ニーズ:
- アプリのテキスト読み上げ(TTS)モデルが言語やアクセントを混同する場面が指摘され、明確な改善ポイントとなりました。バグ報告:
インタビューで挙がった具体的な問題は、翌日エンジニアチームが修正しました。
今後の展望
今後のユーザーリサーチは会話型が主流になります。AIボイスエージェントを使えば、世界中のユーザーと好きなタイミングで会話し、声を直接聞くことができます。
このテストで、AIエージェントが現実的かつ確実に大規模なインタビューを実施できることがわかりました。LLMによるテキスト分析と組み合わせることで、数百件の回答からパターンを発見でき、手作業では難しいインサイトも得られました。ElevenLabs Agentsで同様のAIインタビュアーを作成できます。今すぐ始めるまたは詳細はこちらからお問い合わせください。
.webp&w=3840&q=80)



