कॉन्टेंट पर जाएं

Claude Code के साथ ElevenAgents बनाना

प्रकाशित
आखिरी बार अपडेट किया गया

सुनेंइस आर्टिकल को सुनें

पहले वॉइस एजेंट्स के लिए लंबी प्रक्रिया और कई वेंडर्स की जरूरत होती थी। अब आप Claude Code के साथ एक पूरा एजेंट दोपहर में ही बना सकते हैं। यह गाइड आपको हर स्टेप पर ले जाएगी: पर्सोना, नॉलेज बेस, वर्कफ़्लो, टूल्स, गार्डरेल्स, टेस्ट्स और एक फोन नंबर जिस पर आप कॉल कर सकते हैं।

आप एक दोपहर में ये सब बना सकते हैं:

  • वॉइस एजेंट जो आपको सुबह उठाकर रात भर की CI फेल्योर की जानकारी देता है
  • अपने साइड प्रोजेक्ट के लिए आज ही मल्टी-लैंग्वेज सपोर्ट लाइन
  • अपने पोर्टफोलियो साइट के लिए इंटरैक्टिव एजेंट जो आपकी तरह बात करता है

वॉइस एजेंट्स में जो सीमाएं थीं—जैसे मैकेनिकल फील, लेटेंसी, प्रोसोदी, टर्न-टेकिंग—अब काफी बेहतर हो गई हैं। हमारा सबसे तेज़ मॉडल लगभग 75ms लेटेंसी पर चलता है, जिसमें टर्न-टेकिंग मॉडल रियल टाइम में पॉज़ और इंटरप्शन हैंडल करता है। Eleven v3 हमारा सबसे एक्सप्रेसिव टेक्स्ट टू स्पीच मॉडल है, जो इंसानों की तरह रजिस्टर बदल सकता है, हँस सकता है और आहें भर सकता है।

जल्दी सेटअप करें

सबसे पहले, Claude Code में नीचे दिए गए प्रॉम्प्ट के साथ ElevenLabs स्किल इंस्टॉल करें:

Install the ElevenLabs skill globally - npx skills add elevenlabs/skills

फिर setup-api-key स्किल चलाएं और अपनी ElevenLabs API key कनेक्ट करें:

Set up the elevenlabs key using the setup-api-key skill.

प्रो टिप: key को सिर्फ "agents-write" तक सीमित रखें और डेली खर्च की सीमा सेट करें। अगर कोई लूप चल गया तो क्रेडिट्स जल्दी खत्म हो सकते हैं।

एजेंट बनाएं

ElevenAgents को इस तरह बनाया गया है कि आप Claude Code में नैचुरल-लैंग्वेज प्रॉम्प्ट्स से कुछ ही मिनटों में प्रोडक्शन-रेडी वॉइस एजेंट बना सकते हैं। इस गाइड में आगे ऐसे ही प्रॉम्प्ट्स दिए गए हैं, जो आपको एक खाली वर्कस्पेस से लेकर एक फोन नंबर तक ले जाएंगे जिस पर आप कॉल कर सकते हैं।

चलें, सबसे पहले एजेंट से शुरू करते हैं। यह पहला प्रॉम्प्ट एक पर्सोना, एक वॉइस और रीजनिंग के लिए LLM के साथ एजेंट बनाता है। अभी कोई टूल्स, नॉलेज बेस या वर्कफ़्लो नहीं—बस सबसे तेज़ तरीका, जिससे आप जीरो से मिनिमम वायबल एजेंट तक पहुँचें।

Create an ElevenAgent: a warm, knowledgeable product expert. Use a v3 conversational voice and Qwen-3.6 as the LLM. Return the dashboard URL.
Agent builder home page web UI

नॉलेज बेस जोड़ें

नॉलेज बेस वो डॉक्युमेंट्स, URLs और FAQs का सेट है, जिन्हें आपका एजेंट किसी सवाल के जवाब में देख सकता है। ElevenAgents आपके लिए रिट्रीवल पाइपलाइन (RAG, या रिट्रीवल-ऑगमेंटेड जेनरेशन) संभालता है। जब कोई यूज़र सवाल पूछता है, प्लेटफ़ॉर्म इंडेक्स किए गए कंटेंट में से सबसे ज़रूरी हिस्से निकालकर LLM को कॉन्टेक्स्ट के तौर पर देता है। सोर्सेज़ में बदलाव होने पर वे ऑटो-रीइंडेक्स हो जाते हैं, जिससे एजेंट आपके डॉक्युमेंट्स के साथ हमेशा अपडेटेड रहता है—आपको बार-बार अपलोड करने की जरूरत नहीं।

Add a knowledge base to my agent. Index 
https://elevenlabs.io/docs/eleven-agents/overview
 and ./README.md if it exists. 

Auto-reindex on.
Knowledge Base interface showing files, storage, and add options

वर्कफ़्लो जोड़ें

एक ही प्रॉम्प्ट वाला एजेंट सीमित टास्क्स अच्छे से कर सकता है। वर्कफ़्लो से आप मल्टी-इंटेंट बातचीत कर सकते हैं। हर व्यवहार को एक ही सिस्टम प्रॉम्प्ट में डालने की बजाय, आप एजेंट को अलग-अलग नोड्स में बांटते हैं, जो हर एक इंटेंट को संभालते हैं, और कॉलर की जरूरत के हिसाब से उनके बीच रूटिंग होती है। हर नोड का अपना व्यवहार होता है, और उनके बीच की रूटिंग LLM द्वारा तय होती है।

Add a workflow to my agent: greeting, classify intent, then branch to either answer from KB or escalate to human, then wrap up.
Agent workflow visual builder of Customer support call flow diagram detailing issue identification, troubleshooting, and resolution steps.

टूल्स जोड़ें

ElevenAgents तीन तरह के टूल्स सपोर्ट करता है, और हर एक का अलग काम है। क्लाइंट टूल्स फ्रंटएंड में UI एक्शन चलाते हैं, जिससे एजेंट नेविगेट कर सकता है, हाइलाइट कर सकता है या यूज़र को दिखने वाली चीज़ें अपडेट कर सकता है। वेबहुक टूल्स आपके सर्वर APIs को कॉल करते हैं, जिससे एजेंट आपके सिस्टम में डेटा पढ़ या लिख सकता है। बिल्ट-इन टूल्स वे कॉमन प्लेटफ़ॉर्म एक्शन हैं जिन्हें आप खुद नहीं बनाना चाहते—जैसे कॉल खत्म करना, कॉलर की भाषा पहचानना या इंसान को ट्रांसफर करना।

Add three tools to my agent: 
1. A client tool called show_help_article that takes an article_id. 
2. A webhook tool called get_weather hitting 
https://wttr.in/
{location}?format=j1. 
3. Enable the built-in end_call and language_detection tools.
Diagram of an ElevenAgents connecting client tools, system tools, and integration tools with webhooks, MCP, and native integrations.

गार्डरेल्स जोड़ें

गार्डरेल्स LLM से अलग चलते हैं, यानी वे उन केसों को पकड़ लेते हैं जो आपके सिस्टम प्रॉम्प्ट से छूट गए। आमतौर पर इन्हें platform_settings में सेट किया जाता है, सिर्फ सिस्टम प्रॉम्प्ट पर निर्भर न रहें। लेकिन सबसे जरूरी नियमों के लिए दोनों जगह सेट करें—सिस्टम प्रॉम्प्ट में भी और अलग से कस्टम गार्डरेल के तौर पर भी। इससे आपको डबल सुरक्षा मिलती है: अगर LLM अपनी इंस्ट्रक्शंस से हट जाए, तो रिस्पॉन्स वैलिडेटर उसे यूज़र तक पहुँचने से पहले पकड़ लेता है।

Add guardrails to my agent. Enable focus and prompt injection protection. Add custom rules to block specific pricing claims, speculation about unreleased features, and any write access to billing systems.

टेस्ट्स जोड़ें

अपने एजेंट को असली यूज़र्स के सामने लाने से पहले, आप चाहेंगे कि वह सही तरह से काम कर रहा है या नहीं। ElevenAgents तीन तरह के टेस्ट्स सपोर्ट करता है, और आमतौर पर आपको तीनों चाहिए होंगे। रिस्पॉन्स टेस्ट्स देखते हैं कि एजेंट सही बात सही टोन में कह रहा है या नहीं। टूल कॉल टेस्ट्स देखते हैं कि वह सही टूल सही पैरामीटर्स के साथ चला रहा है या नहीं। सिमुलेशन टेस्ट्स देखते हैं कि जब बातचीत स्क्रिप्ट से बाहर जाती है, तब भी मल्टी-टर्न फ्लो सही चलता है या नहीं।

Add three tests to my agent: one that checks the greeting tone, one that checks it calls show_help_article when asked about password resets, and a simulation that checks if it defers to sales when asked about pricing.
ElevenAgents testing suite being ran to test agents before they reach production

फोन पर सेट करें

अब तक एजेंट सिर्फ डैशबोर्ड में चलता है। इसे फोन नंबर से जोड़ने पर वॉइस ट्रैफिक टेलीफोनी प्रोवाइडर के ज़रिए रूट होता है, जिससे इनबाउंड और आउटबाउंड कॉल्स मुमकिन हो जाती हैं। कॉलर्स कॉल कर सकते हैं, आपका एजेंट कॉल कर सकता है, और ऑडियो टेलीफोनी प्रोवाइडर के ज़रिए रूट होता है। ElevenAgents में Twilio, SIP ट्रंक, Vonage, Telnyx, Plivo और Genesys के लिए नेटिव इंटीग्रेशन है, जिससे बीच में कोई थर्ड-पार्टी मीडिया सर्वर या मैन्युअल TwiML रूटिंग की जरूरत नहीं। पूरी स्टैक—वॉइस मॉडल से लेकर LLM और टेलीफोनी प्रोवाइडर तक—एक ही प्लेटफ़ॉर्म में कनेक्ट हो जाती है।

नेटिव Twilio इंटीग्रेशन सबसे तेज़ सेटअप है। आप अपने Twilio नंबर को ElevenAgents डैशबोर्ड में अपने Account SID और Auth Token के साथ इम्पोर्ट करते हैं, और प्लेटफ़ॉर्म अपने आप वॉइस वेबहुक्स और ऑडियो फॉर्मेट सेट कर देता है। एक बात पहले से जान लें: Twilio से खरीदे गए नंबर इनबाउंड और आउटबाउंड दोनों कॉल्स सपोर्ट करते हैं। Twilio में caller ID के तौर पर वेरिफाई किए गए नंबर सिर्फ आउटबाउंड कॉल्स के लिए होते हैं।

Connect my Twilio account to ElevenAgents. Reserve a +1 number from Twilio's available pool, assign it my ElevenAgent via the native Twilio integration, and return the number to dial.

प्रो टिप: अगर आपके पास Twilio नहीं है, तो डैशबोर्ड का Talk to Agent बटन ब्राउज़र में काम करता है। फोन नंबर प्रोडक्शन के लिए है।

अब आपके पास ऐसा वॉइस एजेंट है, जो वॉइस एजेंट जैसा नहीं लगता।

संबंधित लेख

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं