वेबिनार सारांश: अपने टेक्स्ट चैटबोट को इंसानों जैसी आवाज़ दें
- प्रकाशित
सुनेंइस आर्टिकल को सुनें
चैट एजेंट अब एंटरप्राइज सॉफ्टवेयर का आम हिस्सा बन चुके हैं। ज़्यादातर कंपनियों के पास एक चैटबोट है या बना रही हैं। लेकिन कम ही लोगों ने सोचा है कि जब यूज़र सिर्फ बात करना चाहे तो क्या होगा।
Nana, सऊदी अरब के सबसे बड़े सुपर ऐप्स में से एक, ने अलग रास्ता चुना।Behind the Agent: Nana कैसे AI एजेंट्स से कस्टमर एक्सपीरियंस बदल रहा हैमें, Karim Mustafa, Nana के हेड ऑफ कस्टमर एक्सपीरियंस, ने बताया कि कंपनी ने अपने सपोर्ट ऑपरेशन में AI एजेंट्स कैसे लगाए और इसका उनकी टीम, लागत और क्वालिटी स्कोर पर क्या असर हुआ।
अब ज़्यादातर टीमें ये नहीं पूछ रहीं कि वॉइस जोड़ना है या नहीं, बल्कि ये सोच रही हैं कि पहले से जो काम कर रहा है, उसे फिर से बनाए बिना वॉइस कैसे जोड़ें।
इस
वॉइस के साथ बनाना जितना दिखता है, उससे ज्यादा मुश्किल क्यों है
Nana ने 2016 में सऊदी अरब में ग्रॉसरी डिलीवरी पायनियर के तौर पर शुरुआत की थी। दस साल में कंपनी ने लॉन्ड्री, कार वॉशिंग, फूड डिलीवरी और बहुत कुछ जोड़कर खुद को एक सुपर ऐप बना लिया। जैसे-जैसे प्रोडक्ट बढ़ा, कस्टमर कॉन्टैक्ट वॉल्यूम भी बढ़ा। टीम को डिमांड पूरी करने के लिए 54 सपोर्ट एजेंट्स को शिफ्ट्स में लगाना पड़ता था।
टर्निंग पॉइंट तब आया जब Nana ने FAQ बॉट्स और बेसिक चैट फ्लो से आगे बढ़कर ElevenLabs पर बना एक असली फ्रंट-एंड AI एजेंट लगाया। ये एजेंट सीधे Nana ऐप में कस्टमर से बात करता है। ये समस्याएं सुलझाता है, सवालों के जवाब देता है, ऑर्डर ट्रैक करता है और जरूरत पड़ने पर एस्केलेट करता है। क्वालिटी तुरंत और लगातार बनी रही।
बिजनेस पर असर साफ था:
- Nana ने अपनी कस्टमर सपोर्ट लागत में 85% की कमी की
- रिस्पॉन्स टाइम सेकंड्स में आ गया
टेक्निकली तो ये चलता है, लेकिन बातचीत के लिहाज से गड़बड़ है।
कॉन्टेक्स्ट दूसरी बड़ी चुनौती है। हर टर्न पर बातचीत का इतिहास LLM को देना ज़रूरी है, लेकिन काफी नहीं। एक ही बात अलग टोन में अलग मतलब देती है - "मैं ठीक हूँ" राहत के साथ और "मैं ठीक हूँ" झुंझलाहट के साथ, ट्रांसक्रिप्ट एक जैसा है, लेकिन बातचीत अलग। अगर वॉइस सिस्टम इस फर्क को नजरअंदाज कर दे, तो चाहे मॉडल कितना भी अच्छा हो, आवाज़ थोड़ी अजीब ही लगेगी।
इंजीनियरिंग का ओवरहेड भी है। जो टीमें खुद वॉइस ऑर्केस्ट्रेशन संभालती हैं, उन्हें टर्न-टेकिंग लॉजिक, इंटरप्शन हैंडलिंग और लेटेंसी प्रोफाइलिंग लगातार मेंटेन करनी पड़ती है। ये एक बार का काम नहीं है।
वॉइस AI इन तीनों का हल देता है: हर बार एक जैसा समाधान, नई जानकारी पर तुरंत एडजस्ट, और किसी भी वॉल्यूम पर स्केल।
मौजूदा एजेंट में वॉइस कैसे जोड़ें
सबसे साफ तरीका है ड्यूल WebSocket आर्किटेक्चर।
Karim ने बताया कि अब टीम समस्याओं के बारे में कैसे सोचती है। जब कोई नया ऑपरेशनल चैलेंज आता है, तो पहला सवाल ये नहीं होता कि कितने लोग चाहिए, बल्कि ये होता है कि एजेंट कितनी जल्दी बन सकता है।
बचे हुए सपोर्ट टीम मेंबर्स को फिक्स्ड शिफ्ट्स या AI-केंद्रित KPI से जुड़े फ्लेक्सिबल ऑवर्स में से चुनने का मौका मिला। हर किसी ने फ्लेक्सिबल मॉडल ही चुना।
Urban Company अब तीन बड़े सब-वर्टिकल्स में वॉइस AI चला रहा है:
- मल्टीमोडल बनेंNana ने पाया कि उनके कस्टमर सिर्फ कॉल ही नहीं, टाइप भी करना चाहते थे। कस्टमर के व्यवहार के हिसाब से चैनल चुनने से अपनाना आसान हुआ और नतीजे जल्दी मिले।
- सिर्फ टेक्नोलॉजी नहीं, प्रॉम्प्ट क्वालिटी पर फोकस करें।AI उतना ही अच्छा काम करेगा, जितना अच्छा आप उसे इंस्ट्रक्शन देंगे। Karim की टीम ने एजेंट को इम्पैथी दिखाने और ब्रांड के मुताबिक जवाब देने के लिए प्रॉम्प्ट्स लिखने में समय लगाया।
- अरबी भाषा के लिए तश्कील का इस्तेमाल करें।एजेंट प्रॉम्प्ट में अरबी टेक्स्ट में वॉवेल मार्किंग जोड़ने से उच्चारण की सटीकता और नैचुरलनेस काफी बढ़ जाती है।
- ह्यूमन एजेंट्स को बाहर नहीं, आगे बढ़ाएं।आपकी बची हुई टीम का सबसे अच्छा इस्तेमाल AI को बेहतर बनाने में है, न कि उसे रिप्लेस करने में। उन्हें वर्कफ्लो डिज़ाइन और क्वालिटी रिव्यू की जिम्मेदारी दें।
- पहले दिन से स्केल के लिए बनाएं।एक बार पहला एजेंट लाइव हो जाए, वही प्लेटफॉर्म आउटबाउंड कॉल्स, इंटरनल वर्कफ्लो, एड्स और क्रॉस-डिपार्टमेंट यूज़ केस भी संभाल सकता है। अब Nana वो डिपार्टमेंट है, जिसे बाकी टीमें नए प्रोजेक्ट जल्दी लॉन्च करने के लिए देखती हैं।
- सीधे सोर्स पर जाएं।Nana ने जिन कई वेंडर्स को परखा, वे ElevenLabs को महंगे दाम पर रीसेल कर रहे थे। सीधे ElevenLabs पर बनाने से Nana को लेटेस्ट मॉडल्स, कम लागत और डायरेक्ट इंजीनियरिंग सपोर्ट मिला।
एक
इंस्टाहेल्पयहाँ।
.webp&w=3840&q=95)
.jpg&w=3840&q=80)


