Claude CodeでElevenAgentsを構築する
- 公開日
- 最終更新日
聴くこの記事を聴く
以前はボイスエージェントを作るのに多くのベンダーや時間が必要でしたが、今はClaude Codeを使えば、午後のうちに一から完成まで作れます。このガイドでは、ペルソナ、ナレッジベース、ワークフロー、ツール、ガードレール、テスト、そして発信できる電話番号まで、すべての手順を紹介します。
午後のうちに作れるもの:
- 夜間のCI失敗をブリーフィングして起こしてくれるボイスエージェント
- サイドプロジェクト向けの多言語サポートライン
- 自分のように話すポートフォリオサイト用のインタラクティブエージェント
これまでボイスエージェントを機械的に感じさせていた制約(遅延、プロソディ、ターンテイクなど)は大きく改善されました。最速のモデルは約75msの低遅延で、リアルタイムでポーズや割り込みに対応するターンテイクモデルを搭載しています。Eleven v3は、声の高さを変えたり、笑ったり、ため息をついたりと、人間らしい表現ができる最も表現力豊かなTTSモデルです。
クイックセットアップ
まず、Claude Codeで以下のプロンプトを使ってElevenLabsスキルをインストールしてください。
次に、setup-api-keyスキルを実行してElevenLabs APIキーを連携してください。
プロのコツ:キーのスコープは「agents-write」のみにし、1日の利用上限を設定しましょう。無限ループが発生するとクレジットがすぐに消費されてしまいます。
エージェントを作成する
ElevenAgentsは、自然言語プロンプトを使ってClaude Codeで本番運用可能なボイスエージェントを数分で立ち上げられるよう設計されています。このガイドの残りは、空のワークスペースから電話番号まで、順を追ってプロンプトを紹介します。
まずはエージェント本体から始めましょう。最初のプロンプトでは、ペルソナ、声、推論を担当するLLMを設定します。ツールやナレッジベース、ワークフローはまだ追加しません。ゼロから最小限のエージェントを作る最速の方法です。

ナレッジベースを追加する
ナレッジベースは、エージェントが質問されたときに参照できるドキュメントやURL、FAQのセットです。ElevenAgentsはリトリーバルパイプライン(RAG:リトリーバル強化生成)を自動で処理します。ユーザーが質問すると、プラットフォームがインデックス済みのコンテンツから関連性の高い部分を抽出し、LLMにコンテキストとして渡してから回答を生成します。ソースが変更されると自動で再インデックスされるので、再アップロードの手間なく常に最新の情報を保てます。

ワークフローを追加する
1つのプロンプトだけのエージェントは特定のタスクに強いですが、ワークフローを追加すると複数の意図に対応した会話が可能になります。すべての動作を1つのシステムプロンプトに詰め込むのではなく、エージェントをそれぞれの意図ごとにノードに分け、発信者のニーズに応じてノード間をルーティングします。各ノードは独自の動作範囲を持ち、ノード間の遷移はLLMが条件を評価して制御します。

ツールを追加する
ElevenAgentsは3種類のツールに対応しており、それぞれ役割が異なります。クライアントツールはフロントエンドでUI操作を実行し、エージェントが画面のナビゲートやハイライト、更新などを行えます。WebhookツールはサーバーAPIを呼び出し、エージェントが自社システムのデータを読み書きできます。ビルトインツールは、通話終了や発信者の言語検出、人への転送など、よく使うプラットフォーム機能をカバーします。
.webp&w=3840&q=95)
ガードレールを追加する
ガードレールはLLMとは独立して動作するため、システムプロンプトでカバーしきれなかった例外も検知できます。基本的にはplatform_settingsで設定するのが一般的ですが、特に重要なルールはシステムプロンプトとカスタムガードレールの両方で設定しましょう。こうすることで多重防御ができ、LLMが指示から逸れてもレスポンスバリデーターがユーザーに届く前に検知します。
テストを追加する
実際のユーザーに公開する前に、エージェントが設計通りに動作するか確認しましょう。ElevenAgentsは3種類のテストに対応しており、通常はすべて実施するのがおすすめです。レスポンステストは、正しい内容・トーンで返答できているかを確認します。ツールコールテストは、正しいパラメータで正しいツールを呼び出せているかをチェックします。シミュレーションテストは、会話が台本通りでなくてもマルチターンの流れが維持できるかを確認します。

電話に接続する
ここまででエージェントはダッシュボード上だけで動作しています。電話番号に接続すると、音声通話がテレフォニー事業者経由でルーティングされ、着信・発信が可能になります。発信者が電話をかけたり、エージェントが発信したりでき、音声はテレフォニー事業者を通じてやり取りされます。ElevenAgentsはTwilio、SIPトランク、Vonage、Telnyx、Plivo、Genesysとネイティブ連携しているため、サードパーティのメディアサーバーや手動のTwiMLルーティングは不要です。ボイスモデルからLLM、テレフォニー事業者まで、すべて1つのプラットフォームでつながります。
Twilioとのネイティブ連携が最も簡単です。TwilioのAccount SIDとAuth Tokenを使ってTwilio番号をElevenAgentsダッシュボードにインポートすると、プラットフォームが音声Webhookやオーディオフォーマットを自動設定します。事前に知っておくと良い点として、Twilioで購入した番号は着信・発信の両方に対応していますが、Twilioで発信者IDとして認証した番号は発信専用です。
プロのコツ:Twilioをまだ持っていない場合は、ダッシュボードの「Talk to Agent」ボタンでブラウザから試せます。電話番号は本番用です。
これで、ボイスエージェントらしくない自然なエージェントが完成です。

.webp&w=3840&q=80)

.webp&w=3840&q=80)
