Claude Code के साथ ElevenAgents बनाना
- प्रकाशित
- आखिरी बार अपडेट किया गया
सुनेंइस आर्टिकल को सुनें
पहले वॉइस एजेंट्स के लिए लंबी प्रक्रिया और कई वेंडर्स की जरूरत होती थी। अब आप Claude Code के साथ एक पूरा एजेंट दोपहर में ही बना सकते हैं। यह गाइड आपको हर स्टेप पर ले जाएगी: पर्सोना, नॉलेज बेस, वर्कफ़्लो, टूल्स, गार्डरेल्स, टेस्ट्स और एक फोन नंबर जिस पर आप कॉल कर सकते हैं।
आप एक दोपहर में ये सब बना सकते हैं:
- वॉइस एजेंट जो आपको सुबह उठाकर रात भर की CI फेल्योर की जानकारी देता है
- अपने साइड प्रोजेक्ट के लिए आज ही मल्टी-लैंग्वेज सपोर्ट लाइन
- अपने पोर्टफोलियो साइट के लिए इंटरैक्टिव एजेंट जो आपकी तरह बात करता है
वॉइस एजेंट्स में जो सीमाएं थीं—जैसे मैकेनिकल फील, लेटेंसी, प्रोसोदी, टर्न-टेकिंग—अब काफी बेहतर हो गई हैं। हमारा सबसे तेज़ मॉडल लगभग 75ms लेटेंसी पर चलता है, जिसमें टर्न-टेकिंग मॉडल रियल टाइम में पॉज़ और इंटरप्शन हैंडल करता है। Eleven v3 हमारा सबसे एक्सप्रेसिव टेक्स्ट टू स्पीच मॉडल है, जो इंसानों की तरह रजिस्टर बदल सकता है, हँस सकता है और आहें भर सकता है।
जल्दी सेटअप करें
सबसे पहले, Claude Code में नीचे दिए गए प्रॉम्प्ट के साथ ElevenLabs स्किल इंस्टॉल करें:
फिर setup-api-key स्किल चलाएं और अपनी ElevenLabs API key कनेक्ट करें:
प्रो टिप: key को सिर्फ "agents-write" तक सीमित रखें और डेली खर्च की सीमा सेट करें। अगर कोई लूप चल गया तो क्रेडिट्स जल्दी खत्म हो सकते हैं।
एजेंट बनाएं
ElevenAgents को इस तरह बनाया गया है कि आप Claude Code में नैचुरल-लैंग्वेज प्रॉम्प्ट्स से कुछ ही मिनटों में प्रोडक्शन-रेडी वॉइस एजेंट बना सकते हैं। इस गाइड में आगे ऐसे ही प्रॉम्प्ट्स दिए गए हैं, जो आपको एक खाली वर्कस्पेस से लेकर एक फोन नंबर तक ले जाएंगे जिस पर आप कॉल कर सकते हैं।
चलें, सबसे पहले एजेंट से शुरू करते हैं। यह पहला प्रॉम्प्ट एक पर्सोना, एक वॉइस और रीजनिंग के लिए LLM के साथ एजेंट बनाता है। अभी कोई टूल्स, नॉलेज बेस या वर्कफ़्लो नहीं—बस सबसे तेज़ तरीका, जिससे आप जीरो से मिनिमम वायबल एजेंट तक पहुँचें।

नॉलेज बेस जोड़ें
नॉलेज बेस वो डॉक्युमेंट्स, URLs और FAQs का सेट है, जिन्हें आपका एजेंट किसी सवाल के जवाब में देख सकता है। ElevenAgents आपके लिए रिट्रीवल पाइपलाइन (RAG, या रिट्रीवल-ऑगमेंटेड जेनरेशन) संभालता है। जब कोई यूज़र सवाल पूछता है, प्लेटफ़ॉर्म इंडेक्स किए गए कंटेंट में से सबसे ज़रूरी हिस्से निकालकर LLM को कॉन्टेक्स्ट के तौर पर देता है। सोर्सेज़ में बदलाव होने पर वे ऑटो-रीइंडेक्स हो जाते हैं, जिससे एजेंट आपके डॉक्युमेंट्स के साथ हमेशा अपडेटेड रहता है—आपको बार-बार अपलोड करने की जरूरत नहीं।

वर्कफ़्लो जोड़ें
एक ही प्रॉम्प्ट वाला एजेंट सीमित टास्क्स अच्छे से कर सकता है। वर्कफ़्लो से आप मल्टी-इंटेंट बातचीत कर सकते हैं। हर व्यवहार को एक ही सिस्टम प्रॉम्प्ट में डालने की बजाय, आप एजेंट को अलग-अलग नोड्स में बांटते हैं, जो हर एक इंटेंट को संभालते हैं, और कॉलर की जरूरत के हिसाब से उनके बीच रूटिंग होती है। हर नोड का अपना व्यवहार होता है, और उनके बीच की रूटिंग LLM द्वारा तय होती है।

टूल्स जोड़ें
ElevenAgents तीन तरह के टूल्स सपोर्ट करता है, और हर एक का अलग काम है। क्लाइंट टूल्स फ्रंटएंड में UI एक्शन चलाते हैं, जिससे एजेंट नेविगेट कर सकता है, हाइलाइट कर सकता है या यूज़र को दिखने वाली चीज़ें अपडेट कर सकता है। वेबहुक टूल्स आपके सर्वर APIs को कॉल करते हैं, जिससे एजेंट आपके सिस्टम में डेटा पढ़ या लिख सकता है। बिल्ट-इन टूल्स वे कॉमन प्लेटफ़ॉर्म एक्शन हैं जिन्हें आप खुद नहीं बनाना चाहते—जैसे कॉल खत्म करना, कॉलर की भाषा पहचानना या इंसान को ट्रांसफर करना।
.webp&w=3840&q=95)
गार्डरेल्स जोड़ें
गार्डरेल्स LLM से अलग चलते हैं, यानी वे उन केसों को पकड़ लेते हैं जो आपके सिस्टम प्रॉम्प्ट से छूट गए। आमतौर पर इन्हें platform_settings में सेट किया जाता है, सिर्फ सिस्टम प्रॉम्प्ट पर निर्भर न रहें। लेकिन सबसे जरूरी नियमों के लिए दोनों जगह सेट करें—सिस्टम प्रॉम्प्ट में भी और अलग से कस्टम गार्डरेल के तौर पर भी। इससे आपको डबल सुरक्षा मिलती है: अगर LLM अपनी इंस्ट्रक्शंस से हट जाए, तो रिस्पॉन्स वैलिडेटर उसे यूज़र तक पहुँचने से पहले पकड़ लेता है।
टेस्ट्स जोड़ें
अपने एजेंट को असली यूज़र्स के सामने लाने से पहले, आप चाहेंगे कि वह सही तरह से काम कर रहा है या नहीं। ElevenAgents तीन तरह के टेस्ट्स सपोर्ट करता है, और आमतौर पर आपको तीनों चाहिए होंगे। रिस्पॉन्स टेस्ट्स देखते हैं कि एजेंट सही बात सही टोन में कह रहा है या नहीं। टूल कॉल टेस्ट्स देखते हैं कि वह सही टूल सही पैरामीटर्स के साथ चला रहा है या नहीं। सिमुलेशन टेस्ट्स देखते हैं कि जब बातचीत स्क्रिप्ट से बाहर जाती है, तब भी मल्टी-टर्न फ्लो सही चलता है या नहीं।

फोन पर सेट करें
अब तक एजेंट सिर्फ डैशबोर्ड में चलता है। इसे फोन नंबर से जोड़ने पर वॉइस ट्रैफिक टेलीफोनी प्रोवाइडर के ज़रिए रूट होता है, जिससे इनबाउंड और आउटबाउंड कॉल्स मुमकिन हो जाती हैं। कॉलर्स कॉल कर सकते हैं, आपका एजेंट कॉल कर सकता है, और ऑडियो टेलीफोनी प्रोवाइडर के ज़रिए रूट होता है। ElevenAgents में Twilio, SIP ट्रंक, Vonage, Telnyx, Plivo और Genesys के लिए नेटिव इंटीग्रेशन है, जिससे बीच में कोई थर्ड-पार्टी मीडिया सर्वर या मैन्युअल TwiML रूटिंग की जरूरत नहीं। पूरी स्टैक—वॉइस मॉडल से लेकर LLM और टेलीफोनी प्रोवाइडर तक—एक ही प्लेटफ़ॉर्म में कनेक्ट हो जाती है।
नेटिव Twilio इंटीग्रेशन सबसे तेज़ सेटअप है। आप अपने Twilio नंबर को ElevenAgents डैशबोर्ड में अपने Account SID और Auth Token के साथ इम्पोर्ट करते हैं, और प्लेटफ़ॉर्म अपने आप वॉइस वेबहुक्स और ऑडियो फॉर्मेट सेट कर देता है। एक बात पहले से जान लें: Twilio से खरीदे गए नंबर इनबाउंड और आउटबाउंड दोनों कॉल्स सपोर्ट करते हैं। Twilio में caller ID के तौर पर वेरिफाई किए गए नंबर सिर्फ आउटबाउंड कॉल्स के लिए होते हैं।
प्रो टिप: अगर आपके पास Twilio नहीं है, तो डैशबोर्ड का Talk to Agent बटन ब्राउज़र में काम करता है। फोन नंबर प्रोडक्शन के लिए है।
अब आपके पास ऐसा वॉइस एजेंट है, जो वॉइस एजेंट जैसा नहीं लगता।

.webp&w=3840&q=80)

.webp&w=3840&q=80)
