ウェビナーまとめ:Cars24がVoice AIで300万分以上の営業通話を自動化する方法

cars-24-bta-cover

Cars24 は、13言語で大規模にプロダクション用の音声エージェントを運用しています。

この記事では、Behind the Agent: Cars24がVoice AIで300万分以上の営業通話を自動化する方法 の内容をまとめています。Cars24のAI&イノベーション責任者Jayesh Gupta氏が、Cars24がどのようにして音声AIシステムを構築・導入したか、最初のシンプルなユースケースから、数百万分の顧客会話を処理するマルチエージェントアーキテクチャまで、詳しく解説しました。

なぜこの規模のVoice AIが重要なのか

Cars24はインド最大級の中古車マーケットプレイスで、インド、UAE、オーストラリアで事業を展開しています。月間4,000~4,500台の車を販売し、10万件以上の検査、2万2,000件以上の試乗を実施しています。

これに加えて、ローンや納車後サポート、罰金支払い、車担保ローンなども対応しています。営業ファネルだけでも、1人の顧客につき30~45日かかります。

購入者の75%は初めて車を買う方です。こうしたお客様にとって、車の購入は単なる取引ではなく、経済的にも感情的にも大きな決断です。つまり、Cars24のプロダクトの70~80%はアプリではなく「会話」です。ファネルのあらゆる段階で、人がガイドし、サポートする営業が重要です。

AIエージェント導入前は、システムが遅くなっていました。顧客が間違ったチームに電話し、営業チームがサポート対応をするなど、待ち時間が長くなり、顧客体験も非効率でした。

待ち時間はどんどん長くなり、30日間のファネルの中でフォローアップが抜け落ちることもありました。

リードの選別からローン書類まで全てを管理するのは、コストも高く、スケールも難しい状況でした。

現在:

  1. 全通話の25%が自動化
  2. 営業の約半分がVoice AIで支援
  3. 通話コストが50%削減

デモ1:Cars24の交渉エージェント

シナリオ: Cars24の音声エージェントが、車の売却を検討している売り手に電話し、ヒンディー語で他社よりCars24を選ぶよう交渉します。

デモ内容:

- エージェントがヒンディー語で営業交渉をフルで実施

- 異議にもリアルタイムで対応し、他社と競合

- 会話は自然で、遅延やロボットのような間がない

- 通話中に売り手がCars24に決めるようクロージング

ポイント:これらのエージェントは積極的に営業し、曖昧な状況にも対応し、異議に反論し、成約へと導きます。しかも顧客が最も話しやすい言語で対応。Cars24は、言語が合うことで会話時間やビジネス成果が直接向上することを確認しています。

デモ2:マルチエージェント連携によるクロスセル

シナリオ: 顧客が検査予約を逃した場合、選別エージェントが再予約のために電話し、アップグレード意向を検知したら、そのまま営業エージェントに通話を転送。営業エージェントは会話の流れを失わずに引き継ぎます。

デモ内容:

- エージェント1(Sneha)が予約漏れに触れて再予約を提案

- Snehaが意向を探る:売り手はアップグレードか、資金目的か?

- 顧客がアップグレード意向を示す

- Snehaが適切なチームへの転送を提案し、通話中に実施

- エージェント2が全ての文脈を引き継ぎ、中古車購入の話を継続

- 顧客が「1時間後にかけ直してほしい」と依頼した際、エージェントが確認し、予約状況をまとめて通話を終了

ポイント:このデモは、実際のマルチエージェント連携の様子を示しています。各エージェントが1つの役割を担当し、文脈がスムーズに受け渡されます。繰り返しや引き継ぎミスはありません。Cars24は、顧客が一度も同じことを繰り返さずに「売る・買う・ローン」まで全て案内できる24時間対応の番号を目指しています。

Cars24の構築方法:技術的なポイント

Cars24は最もシンプルなユースケース、つまり予約漏れリマインダーから始めました。短い通話、二択の結果、失敗してもリスクが低い。これで何が有効かを学び、次の展開につなげました。

より長く複雑な着信通話(平均7分、最長13分の車探し会話)に進んだ際、シングルエージェント構成では限界に達しました。

ミニモデルは3~4分を超えると文脈を失い始めました。

大きなモデルは遅延が発生しました。

全てを1つのプロンプトに詰め込むと、システムが脆弱になり、ローンの流れを変えるだけで購入フローも壊れてしまいました。

そこで解決策としてマルチエージェント連携を採用。会話を段階ごとに分割しました:

  1. ミニモデルを使った小さな選別エージェントが最初の意向を把握
  2. 顧客が関心を持ち、少し待てる場合は大きなモデルが車探しを担当
  3. 価格やローンの話が出た場合のみ、ローン専用の第3エージェントが起動

各エージェントは1つの役割に特化。1つを変更しても他に影響しません。

最終的な構成(ElevenAgentsプラットフォームで連携):

  1. 音声認識:ElevenLabs Scribe v2リアルタイム。13言語のノイズが多いTier2・Tier3環境でも高精度なため採用
  2. テキスト読み上げ:ElevenLabs Flash 2.5。最近V3表現モードにアップグレードされ、営業成果が向上
  3. LLM:ほとんどの用途でGPT-4.1 mini、より深い推論が必要な長い会話にはGPT-4oまたは同等モデル
  4. 電話:音質向上のため24kHzのPCMでWebSocketsを利用。インドではTwilio、Exotel、Plivoなどを使用
  5. 連携:ElevenLabs AgentsプラットフォームへのカスタムAPIコール、MCP対応、オーストラリア市場向けHubSpot連携
  6. ベクターデータベース:Qdrant。100万ベクトル超の大規模データセットでも遅延・コストを抑えるためバイナリ量子化を利用

ElevenLabs Agentsを使う決め手は、STT・LLM・TTSを個別に組み合わせるよりも「遅延」が大幅に減ることでした。

同じモデルを使って自前でパイプラインを構築しても、遅延は常に1秒を超えてしまいました。

Cars24のベストプラクティス

Cars24のベストプラクティス

1. 失敗コストが最も低いところから始めること。Cars24の最初のユースケースは予約漏れリマインダー。短くシンプルでリスクも低い。ここでモデルの有効性を証明し、チームが学ぶ余裕を作ってから、より価値の高いファネルへ展開しました。

2. シミュレーションではなく実際の顧客で運用すること。社内テストでは実際の会話の混乱は再現できません。Cars24はライブトラフィックの10%でパイロットを実施し、一時的な成果低下も受け入れ、実際のフィードバックで改善しました。

3. プロンプトの長さを厳格に制限すること。 Cars24は2分未満の通話でプロンプトを4,000~5,000トークンに制限。長すぎるとモデルが遅くなり、成果も安定しません。必要なら別エージェントを作ります。

4. よくある回答はプロンプト内に入れること。顧客が実際によく聞く質問への回答は、直接プロンプトに記載。ツール呼び出しやRAG検索は残り20%に限定。これで知識検索による遅延の大半を解消できます。

5. 最初のメッセージは事前録音すること。ElevenLabs Agentsは、通話接続前に最初のメッセージを事前生成・キャッシュ可能。さらに最初のメッセージを割り込み不可にすることで、ネットワーク遅延や早すぎる割り込みによる離脱を防げます。

6. 全ての通話に評価を組み込むこと。Cars24は全通話でElevenLabs Agentsの評価機能を使い、SOP遵守や顧客の不満、失敗の有無をチェック。失敗時は手動レビュー、ランダムサンプルは毎日監査。チームは常に先手で対応できます。

7. 段階的にスケールアップすること。新しいエージェント導入は5%→10%→20%→50%→100%の順で、各段階で2日間の保留期間を設け、評価指標が安定しているか確認してから拡大します。

8. 連絡を希望していない顧客には電話しないこと。 Cars24のアウトバウンド通話は、すでにファネルに入った方だけが対象。望まないAIからの連絡はクレームや信頼低下につながります。ルールはシンプル:関与していない人には電話しません。

9. AIかどうか聞かれたら正直に答えること。 Cars24のエージェントは、質問された場合はバーチャルアシスタントであることを明確に伝えます。人間対応を希望された場合はすぐに転送します。

セッション全編を見る AIコストは投資項目として扱うこと。Cars24はAIコストを年間の運営計画に組み込み、具体的なビジネス成果と紐付けています。全ての導入で、実際の指標改善が求められます。

フルセッションを見る

フルセッションを見る

cars-24-bta

ウェビナー全編をオンデマンドで視聴こちら

ElevenLabsチームによる記事をもっと見る

最高品質のAIオーディオで創造する