कॉन्टेंट पर जाएं

वेबिनार रिकैप: Learna ने ElevenLabs के साथ वॉइस लर्निंग को कैसे स्केल किया

Learna ने ElevenLabs के साथ वॉइस लर्निंग को कैसे स्केल किया

Behind the Agent: How Learna Scales Voice Learning with ElevenLabs

Cars2413 भाषाओं में बड़े पैमाने पर प्रोडक्शन वॉइस एजेंट्स चला रहा है।

इंश्योरेंस में वॉइस AI क्यों जरूरी हैBehind the Agent: Cars24 कैसे वॉइस AI से 30 लाख+ मिनट की सेल्स कॉल्स ऑटोमेट करता है का सारांश है, जिसमें Cars24 के AI और इनोवेशन हेड जयेश गुप्ता ने बताया कि Cars24 ने अपना वॉइस AI सिस्टम कैसे बनाया और लागू किया — एक सिंपल यूज़ केस से लेकर मल्टी-एजेंट आर्किटेक्चर तक, जो लाखों मिनट की कस्टमर बातचीत संभालता है।

भाषा सीखने जैसा यूज़ केस तभी काम करता है जब वह असली लगे। इसी सोच के साथ Codeway ने Learna बनाया, जो एक AI-पावर्ड भाषा सीखने वाला ऐप है, जिसे शुरू से ही रियल-टाइम बोले जाने वाली बातचीत के लिए डिज़ाइन किया गया है।

एक ही बातचीत में सिस्टम को तुर्की समझना और उसी फ्लो में इंग्लिश सही से बोलनी पड़ सकती है।

Behind the Agent: Learna

नतीजे सांख्यिकीय रूप से महत्वपूर्ण थे:

इन आंकड़ों ने Codeway की वॉइस को लेकर सोच बदल दी। अब यह सिर्फ UX सुधार नहीं था, बल्कि ग्रोथ का जरिया बन गया था।

Learna में बाइलिंगुअल एक्सपीरियंस लाने से पहले, प्रोडक्ट में खासकर शुरुआती यूज़र्स के लिए एंगेजमेंट कम था।

Learna से बेस्ट प्रैक्टिसेज़

आज:

  1. कुल कॉल वॉल्यूम का 25% ऑटोमेटेड है
  2. लगभग आधी सेल्स वॉइस AI से असिस्टेड है
  3. कॉलिंग कॉस्ट 50% कम हो गई है

डेमो 1: Cars24 का नेगोशिएशन एजेंट

सीन: एक Cars24 वॉइस एजेंट ऐसे सेलर को कॉल करता है जो अपनी कार बेचने का सोच रहा है, और हिंदी में बातचीत कर उसे Cars24 चुनने के लिए मनाता है।

क्या दिखाया गया:

- एजेंट पूरी सेल्स नेगोशिएशन हिंदी में करता है

- यह आपत्तियों को संभालता है और रियल टाइम में दूसरी प्लेटफॉर्म्स से मुकाबला करता है

- बातचीत नेचुरल लगती है, लेटेंसी कम है और कोई रोबोटिक पॉज़ नहीं है

- एजेंट कॉल के दौरान सेलर को Cars24 के लिए कमिट करा लेता है

यह क्यों ज़रूरी है:ये एजेंट्स एक्टिव सेल्स करते हैं, अस्पष्टता संभालते हैं, आपत्तियों पर जवाब देते हैं और कस्टमर की पसंद को कन्वर्जन में बदलते हैं — वो भी उस भाषा में जिसमें कस्टमर सबसे सहज है। Cars24 ने पाया कि भाषा का मेल सीधे बातचीत के समय और बिज़नेस रिज़ल्ट्स को बढ़ाता है।

डेमो 2: मल्टी-एजेंट ऑर्केस्ट्रेशन से क्रॉस-सेल

सीन: एक कस्टमर ने इंस्पेक्शन अपॉइंटमेंट मिस कर दिया। एक क्वालिफिकेशन एजेंट कॉल करता है, अपॉइंटमेंट रीशेड्यूल करता है, अपग्रेड इंटेंट पहचानता है और कॉल को लाइव सेल्स एजेंट को ट्रांसफर कर देता है, जो बिना कॉन्टेक्स्ट खोए बातचीत जारी रखता है।

क्या दिखाया गया:

- एजेंट 1 (स्नेहा) मिस्ड अपॉइंटमेंट का ज़िक्र करती है और उसे रीशेड्यूल करती है

- स्नेहा इंटेंट पूछती है: क्या सेलर अपग्रेड कर रहा है या फाइनेंशियल वजह से बेच रहा है?

- कस्टमर अपग्रेड इंटेंट दिखाता है

- स्नेहा सही टीम को ट्रांसफर करने का ऑफर देती है और कॉल के बीच में ट्रांसफर कर देती है

- एजेंट 2 पूरा कॉन्टेक्स्ट लेकर बातचीत को यूज़्ड कार खरीदने की ओर बढ़ाता है

- जब कस्टमर कहता है कि एक घंटे बाद कॉल करें, एजेंट कन्फर्म करता है, अपॉइंटमेंट स्टेटस दोहराता है और कॉल अच्छे से खत्म करता है

यह क्यों ज़रूरी है:यह डेमो दिखाता है कि असल में मल्टी-एजेंट ऑर्केस्ट्रेशन कैसा दिखता है। हर एजेंट एक काम संभालता है और कॉन्टेक्स्ट उनके बीच पास होता है। न दोहराव है, न कोई हैंडऑफ मिस होता है। Cars24 एक ऐसा 24/7 नंबर बना रहा है, जहां कस्टमर अपनी पूरी जर्नी — बेचना, खरीदना, फाइनेंस — बिना खुद को दोहराए पूरी कर सके।

Cars24 ने इसे कैसे बनाया: टेक्निकल बातें

Cars24 ने सबसे सिंपल यूज़ केस से शुरुआत की: मिस्ड अपॉइंटमेंट रिमाइंडर। छोटी कॉल्स, बाइनरी रिज़ल्ट, कम गलती की कीमत। इससे वे सीख पाए कि क्या काम करता है, फिर आगे बढ़े।

जब वे लंबी, ज्यादा जटिल इनबाउंड कॉल्स पर गए — कार डिस्कवरी की बातचीत औसतन 7 मिनट, कभी-कभी 13 मिनट तक — तो सिंगल-एजेंट आर्किटेक्चर की लिमिट आ गई।

मिनी मॉडल्स 3-4 मिनट के बाद कॉन्टेक्स्ट खोने लगे।

बड़े मॉडल्स में लेटेंसी बढ़ गई।

सब कुछ एक ही प्रॉम्प्ट में डालने से सिस्टम नाज़ुक हो गया: लोन फ्लो में बदलाव से बायिंग फ्लो टूट सकता था।

उनका हल था मल्टी-एजेंट ऑर्केस्ट्रेशन। उन्होंने बातचीत को स्टेजेस में बांटा:

  1. एक छोटा क्वालिफिकेशन एजेंट (मिनी मॉडल से) शुरुआती इंटेंट पकड़ता है
  2. कस्टमर इंगेज होने और थोड़ा इंतजार करने को तैयार होने पर बड़ा मॉडल डिस्कवरी संभालता है
  3. तीसरा, लोन पर फोकस एजेंट सिर्फ तब एक्टिव होता है जब प्राइस या फाइनेंसिंग की बात आती है।

हर एजेंट एक चीज़ अच्छे से करता है। एक में बदलाव से बाकी नहीं टूटते।

उन्होंने जो स्टैक चुना (ElevenAgents प्लेटफॉर्म से ऑर्केस्ट्रेटेड):

  1. स्पीच-टू-टेक्स्ट: ElevenLabs Scribe v2 रियल-टाइम, 13 भाषाओं में शोर वाले Tier 2 और Tier 3 माहौल में सटीकता के लिए चुना गया
  2. टेक्स्ट-टू-स्पीच: ElevenLabs Flash 2.5, हाल ही में V3 एक्सप्रेसिव मोड में अपग्रेड किया गया, जिससे सेल्स परफॉर्मेंस में साफ़ सुधार दिखा
  3. LLM: ज्यादातर यूज़ केस के लिए GPT-4.1 मिनी, और लंबी डिस्कवरी कॉल्स के लिए GPT-4o या समकक्ष, जहां गहराई से सोचने की ज़रूरत है
  4. टेलीफोनी: ऑडियो क्वालिटी के लिए WebSockets के साथ PCM 24kHz पर; भारत में इनके प्रोवाइडर हैं Twilio, Exotel और Plivo
  5. इंटीग्रेशन: ElevenLabs Agents प्लेटफॉर्म में कस्टम API कॉल्स, MCP सपोर्ट, और ऑस्ट्रेलियाई मार्केट के लिए नेटिव HubSpot इंटीग्रेशन
  6. वेक्टर डेटाबेस: Qdrant, बड़े डाटासेट (10 लाख से ज्यादा वेक्टर) के लिए बाइनरी क्वांटाइज़ेशन, ताकि लेटेंसी और कॉस्ट कम रहे

अलग-अलग STT, LLM और TTS कंपोनेंट्स जोड़ने के बजाय ElevenLabs Agents चुनने का सबसे बड़ा कारण था — लेटेंसी।

खुद पाइपलाइन बनाते हुए, वही मॉडल्स इस्तेमाल करने पर भी लेटेंसी लगातार एक सेकंड से ऊपर चली जाती थी।

Cars24 से बेस्ट प्रैक्टिसेज़

Cars24 से बेस्ट प्रैक्टिसेज़

1. वहां से शुरू करें जहां फेल होने की कीमत सबसे कम हो।Cars24 का पहला यूज़ केस था मिस्ड अपॉइंटमेंट रिमाइंडर — छोटी, सिंपल, कम रिस्क वाली कॉल्स। वहां मॉडल को साबित करने से टीम को सीखने का मौका मिला, फिर वे फनल के अहम हिस्सों पर गए।

2. असली कस्टमर्स पर चलाएं, सिर्फ सिम्युलेशन पर नहीं।इंटरनल टेस्टिंग असली बातचीत की अनिश्चितता नहीं दिखा सकती। Cars24 ने अपने पायलट 10% लाइव ट्रैफिक पर चलाए, अस्थायी गिरावट स्वीकार की और असली फीडबैक से सुधार किया।

3. प्रॉम्प्ट की लंबाई को सख्त लिमिट में रखें। Cars24 दो मिनट से कम कॉल्स के लिए प्रॉम्प्ट 4,000-5,000 टोकन तक सीमित रखता है। लंबा प्रॉम्प्ट मॉडल को धीमा करता है और रिज़ल्ट बेहतर नहीं करता। अगर ज़रूरत हो तो नया एजेंट बनाएं।

4. आम सवालों के जवाब प्रॉम्प्ट में रखें, न कि नॉलेज बेस में।कस्टमर के सबसे ज़्यादा पूछे जाने वाले सवालों के जवाब सीधे प्रॉम्प्ट में डालें। टूल कॉल्स और RAG रिट्रीवल सिर्फ बाकी 20% के लिए रखें। इससे नॉलेज लुकअप में लेटेंसी स्पाइक्स लगभग खत्म हो जाते हैं।

5. पहली मैसेज प्री-रिकॉर्ड करें।ElevenLabs Agents कॉल कनेक्ट होने से पहले ही ओपनिंग मैसेज जेनरेट और कैश कर सकते हैं। पहली मैसेज को इंटरप्ट न होने देने के साथ, इससे नेटवर्क लैग या जल्दी कटने से होने वाले ड्रॉप-ऑफ कम होते हैं।

6. हर कॉल में इवैल्यूएशन जोड़ें।Cars24 हर कॉल पर ElevenLabs Agents की इवैल्स से ट्रैक करता है कि SOPs फॉलो हुए या नहीं, कस्टमर ने फ्रस्ट्रेशन दिखाया या नहीं, और कुछ फेल हुआ या नहीं। फेल इवैल्स पर मैन्युअल रिव्यू होता है। रैंडम सैंपल्स रोज़ ऑडिट होते हैं। टीम प्रोएक्टिव रहती है, रिएक्टिव नहीं।

7. स्टेजेस में स्केल करें।नए एजेंट डिप्लॉयमेंट 5%, 10%, 20%, 50%, 100% रोलआउट में होते हैं, हर स्टेज पर दो दिन रुककर इवैल मेट्रिक्स चेक किए जाते हैं, फिर आगे बढ़ते हैं।

8. उन कस्टमर्स को कॉल न करें जिन्होंने खुद संपर्क नहीं किया। हर Cars24 आउटबाउंड कॉल सिर्फ उन्हीं को जाती है जो पहले से फनल में हैं। बिना पूछे AI कॉल्स से शिकायतें बढ़ती हैं और भरोसा टूटता है। नियम साफ है: अगर वे इंगेज नहीं हैं, तो कॉल नहीं करते।

9. जब कस्टमर पूछे कि क्या वे AI से बात कर रहे हैं, तो सच बताएं। Cars24 एजेंट्स पूछे जाने पर बताते हैं कि वे वर्चुअल असिस्टेंट हैं। अगर कस्टमर इंसान चाहता है, तो कॉल तुरंत ट्रांसफर हो जाती है।

पूरा सेशन देखें AI खर्च को लागत नहीं, इन्वेस्टमेंट मानें।Cars24 अब AI खर्च को अपनी सालाना ऑपरेटिंग प्लान में शामिल करता है, हर प्रोजेक्ट को मापने योग्य बिज़नेस रिज़ल्ट से जोड़ता है। हर डिप्लॉयमेंट से असली मेट्रिक में बदलाव की उम्मीद होती है।

पूरा सेशन देखें

पूरा सेशन देखें

cars-24-bta

पूरा वेबिनार ऑन डिमांड देखेंयहाँ.

ElevenLabs टीम के लेखों को देखें

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं