कॉन्टेंट पर जाएं

वर्कशॉप रिकैप: 45 मिनट में AI SDR बनाएं

ऐसा AI SDR एजेंट बनाएं जो लीड्स को क्वालिफाई करे और मीटिंग्स बुक करे

ai-sdr-workshop

Cars2413 भाषाओं में बड़े पैमाने पर प्रोडक्शन वॉइस एजेंट्स चला रहा है।

AI SDR एजेंट क्यों ज़रूरी हैंBehind the Agent: Cars24 कैसे वॉइस AI से 30 लाख+ मिनट की सेल्स कॉल्स ऑटोमेट करता है का सारांश है, जिसमें Cars24 के AI और इनोवेशन हेड जयेश गुप्ता ने बताया कि Cars24 ने अपना वॉइस AI सिस्टम कैसे बनाया और लागू किया — एक सिंपल यूज़ केस से लेकर मल्टी-एजेंट आर्किटेक्चर तक, जो लाखों मिनट की कस्टमर बातचीत संभालता है।

इनमें से कुछ चुनौतियाँ थीं:

इसे ऑटोमेट करने का बिज़नेस केस सीधा था।

AI SDR एजेंट 24/7 चलता है, 70 से ज़्यादा भाषाओं में काम करता है, तय मानदंडों के हिसाब से लीड्स को क्वालिफाई करता है, और कॉल के दौरान ही डायरेक्ट कैलेंडर पर मीटिंग बुक करता है। कोई हैंडऑफ डिले नहीं। कोई टाइम ज़ोन की दिक्कत नहीं।

उनके 75% खरीदार पहली बार कार खरीद रहे हैं। इनके लिए कार खरीदना सिर्फ एक ट्रांजैक्शन नहीं है, बल्कि एक बड़ा फाइनेंशियल और इमोशनल फैसला है। यानी Cars24 का 70-80% प्रोडक्ट ऐप नहीं, बल्कि बातचीत है — हर स्टेज पर इंसानी गाइडेंस और मदद।

डेमो 1: AI SDR की लाइव झलक

वेटिंग टाइम बढ़ रहा था। 30 दिन के फनल में फॉलो-अप मिस हो जाते थे।

क्या दिखाया गया:

यह क्यों ज़रूरी है:

  1. कुल कॉल वॉल्यूम का 25% ऑटोमेटेड है
  2. लगभग आधी सेल्स वॉइस AI से असिस्टेड है
  3. कॉलिंग कॉस्ट 50% कम हो गई है

Workflows

विश्लेषण और डेटा कलेक्शन एक Cars24 वॉइस एजेंट ऐसे सेलर को कॉल करता है जो अपनी कार बेचने का सोच रहा है, और हिंदी में बातचीत कर उसे Cars24 चुनने के लिए मनाता है।

बेस्ट प्रैक्टिसेज़

- एजेंट पूरी सेल्स नेगोशिएशन हिंदी में करता है

पूरा सेशन देखें

पूरा सेशन देखें

- एजेंट कॉल के दौरान सेलर को Cars24 के लिए कमिट करा लेता है

यह क्यों ज़रूरी है:ये एजेंट्स एक्टिव सेल्स करते हैं, अस्पष्टता संभालते हैं, आपत्तियों पर जवाब देते हैं और कस्टमर की पसंद को कन्वर्जन में बदलते हैं — वो भी उस भाषा में जिसमें कस्टमर सबसे सहज है। Cars24 ने पाया कि भाषा का मेल सीधे बातचीत के समय और बिज़नेस रिज़ल्ट्स को बढ़ाता है।

डेमो 2: मल्टी-एजेंट ऑर्केस्ट्रेशन से क्रॉस-सेल

सीन: एक कस्टमर ने इंस्पेक्शन अपॉइंटमेंट मिस कर दिया। एक क्वालिफिकेशन एजेंट कॉल करता है, अपॉइंटमेंट रीशेड्यूल करता है, अपग्रेड इंटेंट पहचानता है और कॉल को लाइव सेल्स एजेंट को ट्रांसफर कर देता है, जो बिना कॉन्टेक्स्ट खोए बातचीत जारी रखता है।

क्या दिखाया गया:

- एजेंट 1 (स्नेहा) मिस्ड अपॉइंटमेंट का ज़िक्र करती है और उसे रीशेड्यूल करती है

- स्नेहा इंटेंट पूछती है: क्या सेलर अपग्रेड कर रहा है या फाइनेंशियल वजह से बेच रहा है?

- कस्टमर अपग्रेड इंटेंट दिखाता है

- स्नेहा सही टीम को ट्रांसफर करने का ऑफर देती है और कॉल के बीच में ट्रांसफर कर देती है

- एजेंट 2 पूरा कॉन्टेक्स्ट लेकर बातचीत को यूज़्ड कार खरीदने की ओर बढ़ाता है

- जब कस्टमर कहता है कि एक घंटे बाद कॉल करें, एजेंट कन्फर्म करता है, अपॉइंटमेंट स्टेटस दोहराता है और कॉल अच्छे से खत्म करता है

यह क्यों ज़रूरी है:यह डेमो दिखाता है कि असल में मल्टी-एजेंट ऑर्केस्ट्रेशन कैसा दिखता है। हर एजेंट एक काम संभालता है और कॉन्टेक्स्ट उनके बीच पास होता है। न दोहराव है, न कोई हैंडऑफ मिस होता है। Cars24 एक ऐसा 24/7 नंबर बना रहा है, जहां कस्टमर अपनी पूरी जर्नी — बेचना, खरीदना, फाइनेंस — बिना खुद को दोहराए पूरी कर सके।

Cars24 ने इसे कैसे बनाया: टेक्निकल बातें

Cars24 ने सबसे सिंपल यूज़ केस से शुरुआत की: मिस्ड अपॉइंटमेंट रिमाइंडर। छोटी कॉल्स, बाइनरी रिज़ल्ट, कम गलती की कीमत। इससे वे सीख पाए कि क्या काम करता है, फिर आगे बढ़े।

जब वे लंबी, ज्यादा जटिल इनबाउंड कॉल्स पर गए — कार डिस्कवरी की बातचीत औसतन 7 मिनट, कभी-कभी 13 मिनट तक — तो सिंगल-एजेंट आर्किटेक्चर की लिमिट आ गई।

मिनी मॉडल्स 3-4 मिनट के बाद कॉन्टेक्स्ट खोने लगे।

बड़े मॉडल्स में लेटेंसी बढ़ गई।

सब कुछ एक ही प्रॉम्प्ट में डालने से सिस्टम नाज़ुक हो गया: लोन फ्लो में बदलाव से बायिंग फ्लो टूट सकता था।

उनका हल था मल्टी-एजेंट ऑर्केस्ट्रेशन। उन्होंने बातचीत को स्टेजेस में बांटा:

  1. एक छोटा क्वालिफिकेशन एजेंट (मिनी मॉडल से) शुरुआती इंटेंट पकड़ता है
  2. कस्टमर इंगेज होने और थोड़ा इंतजार करने को तैयार होने पर बड़ा मॉडल डिस्कवरी संभालता है
  3. तीसरा, लोन पर फोकस एजेंट सिर्फ तब एक्टिव होता है जब प्राइस या फाइनेंसिंग की बात आती है।

हर एजेंट एक चीज़ अच्छे से करता है। एक में बदलाव से बाकी नहीं टूटते।

उन्होंने जो स्टैक चुना (ElevenAgents प्लेटफॉर्म से ऑर्केस्ट्रेटेड):

  1. स्पीच-टू-टेक्स्ट: ElevenLabs Scribe v2 रियल-टाइम, 13 भाषाओं में शोर वाले Tier 2 और Tier 3 माहौल में सटीकता के लिए चुना गया
  2. टेक्स्ट-टू-स्पीच: ElevenLabs Flash 2.5, हाल ही में V3 एक्सप्रेसिव मोड में अपग्रेड किया गया, जिससे सेल्स परफॉर्मेंस में साफ़ सुधार दिखा
  3. LLM: ज्यादातर यूज़ केस के लिए GPT-4.1 मिनी, और लंबी डिस्कवरी कॉल्स के लिए GPT-4o या समकक्ष, जहां गहराई से सोचने की ज़रूरत है
  4. टेलीफोनी: ऑडियो क्वालिटी के लिए WebSockets के साथ PCM 24kHz पर; भारत में इनके प्रोवाइडर हैं Twilio, Exotel और Plivo
  5. इंटीग्रेशन: ElevenLabs Agents प्लेटफॉर्म में कस्टम API कॉल्स, MCP सपोर्ट, और ऑस्ट्रेलियाई मार्केट के लिए नेटिव HubSpot इंटीग्रेशन
  6. वेक्टर डेटाबेस: Qdrant, बड़े डाटासेट (10 लाख से ज्यादा वेक्टर) के लिए बाइनरी क्वांटाइज़ेशन, ताकि लेटेंसी और कॉस्ट कम रहे

अलग-अलग STT, LLM और TTS कंपोनेंट्स जोड़ने के बजाय ElevenLabs Agents चुनने का सबसे बड़ा कारण था — लेटेंसी।

खुद पाइपलाइन बनाते हुए, वही मॉडल्स इस्तेमाल करने पर भी लेटेंसी लगातार एक सेकंड से ऊपर चली जाती थी।

Cars24 से बेस्ट प्रैक्टिसेज़

Cars24 से बेस्ट प्रैक्टिसेज़

1. वहां से शुरू करें जहां फेल होने की कीमत सबसे कम हो।Cars24 का पहला यूज़ केस था मिस्ड अपॉइंटमेंट रिमाइंडर — छोटी, सिंपल, कम रिस्क वाली कॉल्स। वहां मॉडल को साबित करने से टीम को सीखने का मौका मिला, फिर वे फनल के अहम हिस्सों पर गए।

2. असली कस्टमर्स पर चलाएं, सिर्फ सिम्युलेशन पर नहीं।इंटरनल टेस्टिंग असली बातचीत की अनिश्चितता नहीं दिखा सकती। Cars24 ने अपने पायलट 10% लाइव ट्रैफिक पर चलाए, अस्थायी गिरावट स्वीकार की और असली फीडबैक से सुधार किया।

3. प्रॉम्प्ट की लंबाई को सख्त लिमिट में रखें। Cars24 दो मिनट से कम कॉल्स के लिए प्रॉम्प्ट 4,000-5,000 टोकन तक सीमित रखता है। लंबा प्रॉम्प्ट मॉडल को धीमा करता है और रिज़ल्ट बेहतर नहीं करता। अगर ज़रूरत हो तो नया एजेंट बनाएं।

4. आम सवालों के जवाब प्रॉम्प्ट में रखें, न कि नॉलेज बेस में।कस्टमर के सबसे ज़्यादा पूछे जाने वाले सवालों के जवाब सीधे प्रॉम्प्ट में डालें। टूल कॉल्स और RAG रिट्रीवल सिर्फ बाकी 20% के लिए रखें। इससे नॉलेज लुकअप में लेटेंसी स्पाइक्स लगभग खत्म हो जाते हैं।

5. पहली मैसेज प्री-रिकॉर्ड करें।ElevenLabs Agents कॉल कनेक्ट होने से पहले ही ओपनिंग मैसेज जेनरेट और कैश कर सकते हैं। पहली मैसेज को इंटरप्ट न होने देने के साथ, इससे नेटवर्क लैग या जल्दी कटने से होने वाले ड्रॉप-ऑफ कम होते हैं।

6. हर कॉल में इवैल्यूएशन जोड़ें।Cars24 हर कॉल पर ElevenLabs Agents की इवैल्स से ट्रैक करता है कि SOPs फॉलो हुए या नहीं, कस्टमर ने फ्रस्ट्रेशन दिखाया या नहीं, और कुछ फेल हुआ या नहीं। फेल इवैल्स पर मैन्युअल रिव्यू होता है। रैंडम सैंपल्स रोज़ ऑडिट होते हैं। टीम प्रोएक्टिव रहती है, रिएक्टिव नहीं।

7. स्टेजेस में स्केल करें।नए एजेंट डिप्लॉयमेंट 5%, 10%, 20%, 50%, 100% रोलआउट में होते हैं, हर स्टेज पर दो दिन रुककर इवैल मेट्रिक्स चेक किए जाते हैं, फिर आगे बढ़ते हैं।

8. उन कस्टमर्स को कॉल न करें जिन्होंने खुद संपर्क नहीं किया। हर Cars24 आउटबाउंड कॉल सिर्फ उन्हीं को जाती है जो पहले से फनल में हैं। बिना पूछे AI कॉल्स से शिकायतें बढ़ती हैं और भरोसा टूटता है। नियम साफ है: अगर वे इंगेज नहीं हैं, तो कॉल नहीं करते।

9. जब कस्टमर पूछे कि क्या वे AI से बात कर रहे हैं, तो सच बताएं। Cars24 एजेंट्स पूछे जाने पर बताते हैं कि वे वर्चुअल असिस्टेंट हैं। अगर कस्टमर इंसान चाहता है, तो कॉल तुरंत ट्रांसफर हो जाती है।

पूरा सेशन देखें AI खर्च को लागत नहीं, इन्वेस्टमेंट मानें।Cars24 अब AI खर्च को अपनी सालाना ऑपरेटिंग प्लान में शामिल करता है, हर प्रोजेक्ट को मापने योग्य बिज़नेस रिज़ल्ट से जोड़ता है। हर डिप्लॉयमेंट से असली मेट्रिक में बदलाव की उम्मीद होती है।

पूरा सेशन देखें

पूरा सेशन देखें

cars-24-bta

पूरा वेबिनार ऑन डिमांड देखेंयहाँ.

ElevenLabs टीम के लेखों को देखें

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं