コンテンツにスキップ

サポートにおける会話型AIの現状

会話型AIを使えば、サポートのコスト削減とスケールアップが可能です

Over-ear headphones with sound wave graphics on a dark blue background.

Stripeは優れたサポートで知られており、期待を超える対応でユーザーを驚かせることも多いです。しかし、本当に良いサポートとは、Twitterで見かける手書きのメモや3Dプリントのトーテムだけではありません。10年以上にわたる人材とソフトウェアの工夫によって、Stripeは年間何百万ものビジネスを支えるカスタマーサービスを構築してきました。私が2015年にStripeへ入社したとき、社員は200人ほどで、サポートチームも会議テーブル1つに収まる規模でした。

私はダブリンで最初のメンバーの一人として採用され、Stripeのグローバルサポート体制の初期拠点を担当しました。5年間の在籍中に、Stripeはサポートチームを専門分野ごとに再編し、外部ベンダーによるTier 1サポートの導入、チャネルや言語の拡大、そして有料サポートプランの追加などを行いました。こうした進化するサポートプログラムの設計やテストに携わる中で、カスタマーサービスをスケールさせる難しさを実感しました。会話型AIがあれば、こうした複雑さももっとシンプルになったはずです。

会話型AI
Conversational AI Diagram

会話型AIには3つの要素があります。これらはシームレスに連携します。スピーチtoテキストがユーザーの意図を捉え、言語モデルが解釈・応答を生成し、テキスト読み上げがその応答を自然な会話に変換します。

  • スピーチtoテキスト:AIの「耳」がユーザーの話す自然言語を高精度でテキスト化します。
  • 言語モデル:AIの「脳」がテキストを処理し、文脈を理解して知的な応答を生成します。
  • テキスト読み上げ:AIの「声」がテキストの応答を自然な音声に変換します。
  • ターンテイキング:専用サービスが割り込みを監視し、会話が自然で人間らしくなるよう調整します。

Stripeに入社したとき、まずはできるだけ多くのプロダクト知識を吸収するのが仕事でした。研修の一環で、経験豊富なエージェントの対応を見学し、過去のサポート事例から学びました。これは、AIエージェントが学習する方法とよく似ています。

AIはパターン認識が得意で、サポート業務も多くがパターン認識です。ユーザーが課題を説明し、サポート担当が情報を処理して知識と照らし合わせ、回答を返します。ただし、サポートは単なる知識ベースの読み上げではありません。優れたカスタマーサービスには共感や創造性、ユーザーと一緒に課題を解決する姿勢が必要です。残念ながら、多くのサポート対応はそこが不足しています。

サポートの現状

サポートは重要な接点ですが、しばしばストレスの原因にもなります。最後に航空会社に電話したときを思い出してください。長時間待たされた挙句、別の部署の担当だと言われ、同じことの繰り返しです。

苦労しているのはお客様だけではありません。質の高いサポート体験を提供するのは難しく、スケールするほどさらに大変です。ソフトウェア中心の現代でも、サポートは「物理的な人手」に縛られています。もし一晩で大量の新規顧客が増えても、AWSインスタンスのように簡単にサポート体制を増やすことはできません。

サポート体制を拡大するには時間もコストもかかります。北米では、サポート担当者の採用・研修・オンボーディングに約12,000ドルかかります。初期費用も含めると、サポート担当者1人あたりの平均コストは時給30~40ドルです。コスト削減のために外部委託する企業もありますが、その場合は時給8~30ドル。表面上は安く見えますが、責任やプロセス、サポート品質のコントロールが難しくなります。

もし数分でサポート体制を立ち上げ、無限にスケールできたらどうでしょう?高品質なサポートを低コストで提供できたら?それが会話型AIの可能性です。長年サポート業務に携わってきた私にとって、これはまさにゲームチェンジャーだと感じています。会話型AI、そしてサポートに何年も携わってきた私としては、これは完全にゲームチェンジャーだと信じています。

AlexisはElevenLabsのAIエージェントの一例です。サポートエージェントとして開発され、ElevenLabsのドキュメント内で稼働しています。現在は1日100件以上の問い合わせに対応しています。

もしAlexisが人間だったらどうでしょう。1日100件の対応ができるサポート担当者はほとんどいません。とても効率の良い担当者でも60件ほど、複雑な問い合わせや経験の浅い担当者なら40件程度でしょう。つまり、最低でも2人は必要で、残業代も発生するかもしれません。

もし担当者が北米拠点なら、100件の対応にかかるコストは最低でも700ドル、平均で約1719ドル、最大で4094ドルにもなります。かなり高額なので、外部委託を検討するかもしれません。その場合は128~480ドル、平均288ドルほど。表面上は安く見えますが、委託先のオンボーディングや管理コスト、基準を満たさない場合のブランドリスクや評判リスクも隠れたコストです。

方法 最小 平均 最大
人間(社内) 1.40 3.44 8.19
人間(外部委託) 0.256 0.576 0.96
AI 0.026 0.031 0.036
出典:thinkhdi.com

AIサポートエージェントの運用コストは、音声部分だけなら1分あたり0.015ドルまで抑えられます。LLM部分も、モデルやナレッジベースの規模によっては1分あたり1~2セント未満です。つまり、100件の対応で約13~18ドル。社内担当者の平均コストより110倍以上、外部委託よりも18倍安くなります。サポート体験としてもAlexisはかなり優秀だと思いますし、この価格なら本当に驚きです。

会話型AIの活用事例

サプライチェーンの多くがアナログな世界の中で、Trabaは人材と企業をつなぐテクノロジーブリッジとして、産業系企業の採用や労務管理を支援しています。Trabaはアプリやダッシュボードも提供していますが、紙のタイムシートや掲示板に慣れた現場では、電話連絡が今も重要な役割を果たしています。

Trabaは、オペレーションチームが最も時間を費やしている電話対応を分析した結果、サポート対応とスケジュール確認の2つが大半を占めていることが分かりました。CTOのAkshay Buddiga氏は「効率化したいプロセスが見つかったら、後から対応するよりも早い段階で自動化を組み込む方が良い」と話しています。

Trabaはユニットエコノミクスに徹底的にこだわり、技術革新でも先を行くため、これらの電話対応を会話型AIに移行することは多くの理由で魅力的でした。スピードとコストを重視しつつも、ユーザー体験も重要でした。ソフトウェアエンジニアのJoseph Besgen氏は「録音を聞かされるのではなく、会話らしく聞こえることが大事でした」と語ります。ElevenLabsのデモはあまりに自然で、テスト中にTraba社員の父親がAIか本物の担当者か区別できなかったほどです。

数千人の軽作業スタッフのスケジュール管理は複雑ですが、医師の予約1件を取るだけなら本来はもっと簡単なはずです。でも、最近医師に電話したことはありますか?患者にとってもストレスですし、医療スタッフの時間も無駄になっています。ElevenLabsと提携し、EliseAIのアシスタントが医療事務のギャップを埋め、予約から請求まで幅広く対応しています。ある病院では、今や86%の電話対応を

今後の展望

Graph showing state of Conversational AI across industry sectors

業界ごとに会話型AIの成長を見ていくと、興味深い傾向が見えてきます。EdTechは会話型AIを最初に導入した分野で、手頃な価格で1対1の個別指導や語学学習が可能になりました。次にカスタマーサポート分野が続きました。サポート対応はパターン認識が中心で、答えはナレッジベースにあり、AIエージェントがユーザーの質問と照合します。物流や医療など、特定業界向けのエンドツーエンドなアプリケーションも増えています。TrabaやEliseAIがその例です。こうした分野は繰り返しやすく予測しやすいため、AIエージェントが得意とする領域です。

会話型AI 原子の領域からビットの世界へのサポートをもたらします。今では、サポートは企業とその顧客にとってより良い体験となる可能性があります。クラウド プロバイダーと同様に、AI サポート チームもスケールアップおよびスケールダウンできます。顧客が電話を保留にして待つ必要がなくなり、世界中にサポート センターを設置するという運用上の煩わしさから解放されます。

この1年で、ボイスエージェントは会話や知識検索が得意になりましたが、これはまだ始まりにすぎません。2025年には、AI音声エージェントがミーティング予約や「プロダクトスペシャリスト」的なサポートの標準プロトコルになると考えています。知識検索型の対応に限られるかもしれませんが、サポート件数を大きく減らし、人間のチームがより価値の高い業務に集中できるようになります。

2026年には、知識検索から実際のアクション実行へと進化します。標準的なAI音声エージェントはAPI呼び出しや外部アプリ連携ができるようになり、ミーティング予約や返金処理なども日常的に行うようになるでしょう。

2027年には、AI音声エージェントがサポートからカスタマーサクセスへと進化します。営業案件全体をAIエージェントが担当し、買い手側も売り手側もAIになる時代が来るかもしれません。多くの人にとっては「最後のフロンティア」に思えるかもしれませんが、私はこれが始まりだと考えています。かつて人間だけのものと思われていた高度な文脈理解や創造的な業務も、AIの領域になっていくでしょう。

サポートはコストセンターから変革され、まずはコストを抑え、最終的にはビジネスの利益を生み出す存在になります。AI音声エージェントが顧客に積極的にアプローチし、解約率を下げ、顧客LTVを高めます。会話型AIは人間のサポートの多くの利点に加え、完璧な記憶力、数十言語対応、24時間365日稼働という強みも持っています。未来はすぐそこまで来ており、すでに始まっています。いつでも即座に、共感的で効果的なサポートが受けられる世界を想像してみてください。もうすぐ、航空会社に電話するのが楽しくなるかもしれません。

ElevenLabsチームによる記事をもっと見る

最高品質のAIオーディオで創造する