वेबिनार रिकैप: Cars24 कैसे वॉइस AI से 30 लाख+ मिनट की सेल्स कॉल्स ऑटोमेट करता है

लेखक
ruta-bhatt
cars-24-bta-cover

Cars2413 भाषाओं में बड़े पैमाने पर प्रोडक्शन वॉइस एजेंट्स चला रहा है।

यह पोस्ट Behind the Agent: Cars24 कैसे वॉइस AI से 30 लाख+ मिनट की सेल्स कॉल्स ऑटोमेट करता है का सारांश है, जिसमें Cars24 के AI और इनोवेशन हेड जयेश गुप्ता ने बताया कि Cars24 ने अपना वॉइस AI सिस्टम कैसे बनाया और लागू किया — एक सिंपल यूज़ केस से लेकर मल्टी-एजेंट आर्किटेक्चर तक, जो लाखों मिनट की कस्टमर बातचीत संभालता है।

इतने बड़े स्तर पर वॉइस AI क्यों ज़रूरी है

Cars24 भारत का सबसे बड़ा यूज़्ड-कार मार्केटप्लेस है, जिसकी भारत, UAE और ऑस्ट्रेलिया में मौजूदगी है। वे हर महीने 4,000 - 4,500 कारें बेचते हैं, 1,00,000+ इंस्पेक्शन करते हैं और 22,000+ टेस्ट ड्राइव करवाते हैं।

इसमें फाइनेंसिंग, डिलीवरी के बाद सपोर्ट, फाइन पेमेंट्स और कार पर लोन जैसी चीज़ें शामिल नहीं हैं। सिर्फ सेल्स फनल ही हर कस्टमर के लिए 30 से 45 दिन लंबा है।

उनके 75% खरीदार पहली बार कार खरीद रहे हैं। इनके लिए कार खरीदना सिर्फ एक ट्रांजैक्शन नहीं है, बल्कि एक बड़ा फाइनेंशियल और इमोशनल फैसला है। यानी Cars24 का 70-80% प्रोडक्ट ऐप नहीं, बल्कि बातचीत है — हर स्टेज पर इंसानी गाइडेंस और मदद।

AI एजेंट्स से पहले सिस्टम धीमा हो रहा था। कस्टमर गलत टीम को कॉल करते थे — सेल्स टीम को सपोर्ट के लिए कॉल आ जाती थी, जिससे वेटिंग टाइम बढ़ता और कस्टमर एक्सपीरियंस खराब होता।

वेटिंग टाइम बढ़ रहा था। 30 दिन के फनल में फॉलो-अप मिस हो जाते थे।

लीड क्वालिफिकेशन से लेकर लोन डॉक्युमेंटेशन तक सब मैनेज करना महंगा और स्केलेबल नहीं था।

आज:

  1. कुल कॉल वॉल्यूम का 25% ऑटोमेटेड है
  2. लगभग आधी सेल्स वॉइस AI से असिस्टेड है
  3. कॉलिंग कॉस्ट 50% कम हो गई है

डेमो 1: Cars24 का नेगोशिएशन एजेंट

सीन: एक Cars24 वॉइस एजेंट ऐसे सेलर को कॉल करता है जो अपनी कार बेचने का सोच रहा है, और हिंदी में बातचीत कर उसे Cars24 चुनने के लिए मनाता है।

क्या दिखाया गया:

- एजेंट पूरी सेल्स नेगोशिएशन हिंदी में करता है

- यह आपत्तियों को संभालता है और रियल टाइम में दूसरी प्लेटफॉर्म्स से मुकाबला करता है

- बातचीत नेचुरल लगती है, लेटेंसी कम है और कोई रोबोटिक पॉज़ नहीं है

- एजेंट कॉल के दौरान सेलर को Cars24 के लिए कमिट करा लेता है

यह क्यों ज़रूरी है:ये एजेंट्स एक्टिव सेल्स करते हैं, अस्पष्टता संभालते हैं, आपत्तियों पर जवाब देते हैं और कस्टमर की पसंद को कन्वर्जन में बदलते हैं — वो भी उस भाषा में जिसमें कस्टमर सबसे सहज है। Cars24 ने पाया कि भाषा का मेल सीधे बातचीत के समय और बिज़नेस रिज़ल्ट्स को बढ़ाता है।

डेमो 2: मल्टी-एजेंट ऑर्केस्ट्रेशन से क्रॉस-सेल

सीन: एक कस्टमर ने इंस्पेक्शन अपॉइंटमेंट मिस कर दिया। एक क्वालिफिकेशन एजेंट कॉल करता है, अपॉइंटमेंट रीशेड्यूल करता है, अपग्रेड इंटेंट पहचानता है और कॉल को लाइव सेल्स एजेंट को ट्रांसफर कर देता है, जो बिना कॉन्टेक्स्ट खोए बातचीत जारी रखता है।

क्या दिखाया गया:

- एजेंट 1 (स्नेहा) मिस्ड अपॉइंटमेंट का ज़िक्र करती है और उसे रीशेड्यूल करती है

- स्नेहा इंटेंट पूछती है: क्या सेलर अपग्रेड कर रहा है या फाइनेंशियल वजह से बेच रहा है?

- कस्टमर अपग्रेड इंटेंट दिखाता है

- स्नेहा सही टीम को ट्रांसफर करने का ऑफर देती है और कॉल के बीच में ट्रांसफर कर देती है

- एजेंट 2 पूरा कॉन्टेक्स्ट लेकर बातचीत को यूज़्ड कार खरीदने की ओर बढ़ाता है

- जब कस्टमर कहता है कि एक घंटे बाद कॉल करें, एजेंट कन्फर्म करता है, अपॉइंटमेंट स्टेटस दोहराता है और कॉल अच्छे से खत्म करता है

यह क्यों ज़रूरी है:यह डेमो दिखाता है कि असल में मल्टी-एजेंट ऑर्केस्ट्रेशन कैसा दिखता है। हर एजेंट एक काम संभालता है और कॉन्टेक्स्ट उनके बीच पास होता है। न दोहराव है, न कोई हैंडऑफ मिस होता है। Cars24 एक ऐसा 24/7 नंबर बना रहा है, जहां कस्टमर अपनी पूरी जर्नी — बेचना, खरीदना, फाइनेंस — बिना खुद को दोहराए पूरी कर सके।

Cars24 ने इसे कैसे बनाया: टेक्निकल बातें

Cars24 ने सबसे सिंपल यूज़ केस से शुरुआत की: मिस्ड अपॉइंटमेंट रिमाइंडर। छोटी कॉल्स, बाइनरी रिज़ल्ट, कम गलती की कीमत। इससे वे सीख पाए कि क्या काम करता है, फिर आगे बढ़े।

जब वे लंबी, ज्यादा जटिल इनबाउंड कॉल्स पर गए — कार डिस्कवरी की बातचीत औसतन 7 मिनट, कभी-कभी 13 मिनट तक — तो सिंगल-एजेंट आर्किटेक्चर की लिमिट आ गई।

मिनी मॉडल्स 3-4 मिनट के बाद कॉन्टेक्स्ट खोने लगे।

बड़े मॉडल्स में लेटेंसी बढ़ गई।

सब कुछ एक ही प्रॉम्प्ट में डालने से सिस्टम नाज़ुक हो गया: लोन फ्लो में बदलाव से बायिंग फ्लो टूट सकता था।

उनका हल था मल्टी-एजेंट ऑर्केस्ट्रेशन। उन्होंने बातचीत को स्टेजेस में बांटा:

  1. एक छोटा क्वालिफिकेशन एजेंट (मिनी मॉडल से) शुरुआती इंटेंट पकड़ता है
  2. कस्टमर इंगेज होने और थोड़ा इंतजार करने को तैयार होने पर बड़ा मॉडल डिस्कवरी संभालता है
  3. तीसरा, लोन पर फोकस एजेंट सिर्फ तब एक्टिव होता है जब प्राइस या फाइनेंसिंग की बात आती है।

हर एजेंट एक चीज़ अच्छे से करता है। एक में बदलाव से बाकी नहीं टूटते।

उन्होंने जो स्टैक चुना (ElevenAgents प्लेटफॉर्म से ऑर्केस्ट्रेटेड):

  1. स्पीच-टू-टेक्स्ट: ElevenLabs Scribe v2 रियल-टाइम, 13 भाषाओं में शोर वाले Tier 2 और Tier 3 माहौल में सटीकता के लिए चुना गया
  2. टेक्स्ट-टू-स्पीच: ElevenLabs Flash 2.5, हाल ही में V3 एक्सप्रेसिव मोड में अपग्रेड किया गया, जिससे सेल्स परफॉर्मेंस में साफ़ सुधार दिखा
  3. LLM: ज्यादातर यूज़ केस के लिए GPT-4.1 मिनी, और लंबी डिस्कवरी कॉल्स के लिए GPT-4o या समकक्ष, जहां गहराई से सोचने की ज़रूरत है
  4. टेलीफोनी: ऑडियो क्वालिटी के लिए WebSockets के साथ PCM 24kHz पर; भारत में इनके प्रोवाइडर हैं Twilio, Exotel और Plivo
  5. इंटीग्रेशन: ElevenLabs Agents प्लेटफॉर्म में कस्टम API कॉल्स, MCP सपोर्ट, और ऑस्ट्रेलियाई मार्केट के लिए नेटिव HubSpot इंटीग्रेशन
  6. वेक्टर डेटाबेस: Qdrant, बड़े डाटासेट (10 लाख से ज्यादा वेक्टर) के लिए बाइनरी क्वांटाइज़ेशन, ताकि लेटेंसी और कॉस्ट कम रहे

अलग-अलग STT, LLM और TTS कंपोनेंट्स जोड़ने के बजाय ElevenLabs Agents चुनने का सबसे बड़ा कारण था — लेटेंसी।

खुद पाइपलाइन बनाते हुए, वही मॉडल्स इस्तेमाल करने पर भी लेटेंसी लगातार एक सेकंड से ऊपर चली जाती थी।

Cars24 से बेस्ट प्रैक्टिसेज़

Cars24 से बेस्ट प्रैक्टिसेज़

1. वहां से शुरू करें जहां फेल होने की कीमत सबसे कम हो।Cars24 का पहला यूज़ केस था मिस्ड अपॉइंटमेंट रिमाइंडर — छोटी, सिंपल, कम रिस्क वाली कॉल्स। वहां मॉडल को साबित करने से टीम को सीखने का मौका मिला, फिर वे फनल के अहम हिस्सों पर गए।

2. असली कस्टमर्स पर चलाएं, सिर्फ सिम्युलेशन पर नहीं।इंटरनल टेस्टिंग असली बातचीत की अनिश्चितता नहीं दिखा सकती। Cars24 ने अपने पायलट 10% लाइव ट्रैफिक पर चलाए, अस्थायी गिरावट स्वीकार की और असली फीडबैक से सुधार किया।

3. प्रॉम्प्ट की लंबाई को सख्त लिमिट में रखें। Cars24 दो मिनट से कम कॉल्स के लिए प्रॉम्प्ट 4,000-5,000 टोकन तक सीमित रखता है। लंबा प्रॉम्प्ट मॉडल को धीमा करता है और रिज़ल्ट बेहतर नहीं करता। अगर ज़रूरत हो तो नया एजेंट बनाएं।

4. आम सवालों के जवाब प्रॉम्प्ट में रखें, न कि नॉलेज बेस में।कस्टमर के सबसे ज़्यादा पूछे जाने वाले सवालों के जवाब सीधे प्रॉम्प्ट में डालें। टूल कॉल्स और RAG रिट्रीवल सिर्फ बाकी 20% के लिए रखें। इससे नॉलेज लुकअप में लेटेंसी स्पाइक्स लगभग खत्म हो जाते हैं।

5. पहली मैसेज प्री-रिकॉर्ड करें।ElevenLabs Agents कॉल कनेक्ट होने से पहले ही ओपनिंग मैसेज जेनरेट और कैश कर सकते हैं। पहली मैसेज को इंटरप्ट न होने देने के साथ, इससे नेटवर्क लैग या जल्दी कटने से होने वाले ड्रॉप-ऑफ कम होते हैं।

6. हर कॉल में इवैल्यूएशन जोड़ें।Cars24 हर कॉल पर ElevenLabs Agents की इवैल्स से ट्रैक करता है कि SOPs फॉलो हुए या नहीं, कस्टमर ने फ्रस्ट्रेशन दिखाया या नहीं, और कुछ फेल हुआ या नहीं। फेल इवैल्स पर मैन्युअल रिव्यू होता है। रैंडम सैंपल्स रोज़ ऑडिट होते हैं। टीम प्रोएक्टिव रहती है, रिएक्टिव नहीं।

7. स्टेजेस में स्केल करें।नए एजेंट डिप्लॉयमेंट 5%, 10%, 20%, 50%, 100% रोलआउट में होते हैं, हर स्टेज पर दो दिन रुककर इवैल मेट्रिक्स चेक किए जाते हैं, फिर आगे बढ़ते हैं।

8. उन कस्टमर्स को कॉल न करें जिन्होंने खुद संपर्क नहीं किया। हर Cars24 आउटबाउंड कॉल सिर्फ उन्हीं को जाती है जो पहले से फनल में हैं। बिना पूछे AI कॉल्स से शिकायतें बढ़ती हैं और भरोसा टूटता है। नियम साफ है: अगर वे इंगेज नहीं हैं, तो कॉल नहीं करते।

9. जब कस्टमर पूछे कि क्या वे AI से बात कर रहे हैं, तो सच बताएं। Cars24 एजेंट्स पूछे जाने पर बताते हैं कि वे वर्चुअल असिस्टेंट हैं। अगर कस्टमर इंसान चाहता है, तो कॉल तुरंत ट्रांसफर हो जाती है।

पूरा सेशन देखें AI खर्च को लागत नहीं, इन्वेस्टमेंट मानें।Cars24 अब AI खर्च को अपनी सालाना ऑपरेटिंग प्लान में शामिल करता है, हर प्रोजेक्ट को मापने योग्य बिज़नेस रिज़ल्ट से जोड़ता है। हर डिप्लॉयमेंट से असली मेट्रिक में बदलाव की उम्मीद होती है।

पूरा सेशन देखें

पूरा सेशन देखें

cars-24-bta

पूरा वेबिनार ऑन डिमांड देखेंयहाँ.

ElevenLabs टीम के लेखों को देखें

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं