Apna ने ElevenLabs का उपयोग करके 7.5 मिलियन AI इंटरव्यू मिनट्स को स्केल किया

भारत में लाखों नौकरी चाहने वालों के लिए मानव-समान मॉक इंटरव्यू बनाना

Apna Blog 1x1.

भारत में इंटरव्यू की तैयारी लंबे समय से टूटी हुई है - सामान्य, असंबद्ध, और अधिकांश नौकरी चाहने वालों के लिए अप्राप्य।

Apna, भारत का प्रमुख नौकरी खोज और करियर प्लेटफ़ॉर्म, इसे बदलने के लिए निकला, ताकि हर मॉक इंटरव्यू वास्तविक लगे - प्रत्येक भूमिका, कंपनी और उम्मीदवार के लिए व्यक्तिगत।

60 मिलियन से अधिक यूज़र्स और 10,000+ कंपनियों के साथ 30,000+ भूमिकाओं में, Apna की दृष्टि को केवल प्रशिक्षण मॉड्यूल से अधिक की आवश्यकता थी। इसे बातचीत की आवश्यकता थी - जीवन्त समय, सहानुभूति, और डोमेन गहराई - बड़े पैमाने पर।

इसे प्राप्त करने के लिए, Apna ने ElevenLabs द्वारा संचालित सबसे उन्नत AI इंटरव्यू इकोसिस्टम में से एक को इंजीनियर कियाText to Speech and Blue Machines’ voice orchestration platform. Together, these systems have delivered over 1.5 million AI interviews, totaling 7.5 million voice minutes, with sub-300 ms latency.

Apna ने ElevenLabs को क्यों चुना

इंटरव्यू सिमुलेशन को प्राकृतिक महसूस कराने के लिए, वॉइस क्वालिटी और रिस्पॉन्सिवनेस अविभाज्य हैं। कोई भी श्रव्य विलंब या रोबोटिक टोन इमर्शन और विश्वास को तोड़ देता है।

Apna ने तीन मुख्य कारणों के लिए ElevenLabs को चुना:

  • लो-लेटेंसी स्ट्रीमिंग परफॉर्मेंस - रिस्पॉन्स 150–180 ms के भीतर प्लेबैक शुरू होते हैं।
  • मल्टीलिंगुअल क्षमता - भारतीय अंग्रेजी, हिंदी, और कोड-मिक्स्ड स्पीच में सहज संश्लेषण।
  • भावनात्मक सूक्ष्मता - टोन मॉड्यूलेशन जो मानव सहानुभूति और चुनौती को दर्शाता है।

ये गुण Apna को वास्तविक बातचीत की लय को बनाए रखने की अनुमति देते हैं, जबकि बड़े पैमाने पर भावनात्मक विश्वसनीयता बनाए रखते हैं।

बड़े पैमाने पर वास्तविक समय मानव यथार्थवाद का ऑर्केस्ट्रेशन

इन जीवंत इंटरव्यूज़ को संभव बनाने के लिए, Apna को एक जटिल समन्वय चुनौती का समाधान करना पड़ा। एक ऐसा मॉक इंटरव्यू देना जो वास्तविक लगे, केवल स्क्रिप्टेड संवाद से अधिक की आवश्यकता होती है; इसमें वॉइस, लेटेंसी, सहानुभूति और संदर्भ के बीच समन्वित सटीकता की आवश्यकता होती है – जो मशीन की गति पर सामंजस्य में काम करते हैं।

हर कंपनी का इंटरव्यू लेने का तरीका अलग होता है। एक प्रोडक्ट मैनेजर की भूमिका को मेट्रिक्स रीजनिंग पर परखा जा सकता है; एक बैंक क्रेडिट अधिकारी की भूमिका को अनुपालन तर्क पर; और एक ई-कॉमर्स प्लेटफॉर्म लीड को रूट ऑप्टिमाइज़ेशन पर।

पर्दे के पीछे, Apna का ऑर्केस्ट्रेशन प्लेटफ़ॉर्म, Blue Machines, ने प्रत्येक भूमिका × कंपनी इंटरसेक्शन के लिए एक रिट्रीवल-ऑगमेंटेड जेनरेशन (RAG) ग्राफ़ बनाया:Blue Machines built a Retrieval-Augmented Generation (RAG) graph for each role × company intersection: 

● 10 000 + कंपनियाँ × 50–100 भूमिकाएँ = ~500 मिलियन माइक्रो-मॉडल।
● प्रत्येक मॉडल कंपनी-विशिष्ट रूब्रिक्स, टोन, और शब्दावली से जुड़ा हुआ।

They integrated ElevenLabs’ streaming TTS directly into its conversational loop. Each turn begins with candidate speech, processed by multilingual ASR and NLU models, followed by workflow logic that evaluates intent, emotional tone, and role-specific context. The system then retrieves relevant domain data, composes the next question, and plays it back through ElevenLabs — all within roughly 300 मिलीसेकंड एंड-टू-एंड।

“प्रत्येक संश्लेषित रिस्पॉन्स ~150–180 ms के भीतर प्लेबैक शुरू होता है, ElevenLabs की लो-लेटेंसी APIs के लिए धन्यवाद, जो सीधे Apna और Blue Machines के ऑर्केस्ट्रेशन लेयर में एकीकृत हैं”, कहा अभिषेक रंजन, CTO, Apna

At 300 ms, the human brain perceives speech as continuous rather than delayed - the threshold where realism begins. 

Function
Edge ingress
Regional gateways + smart routing
ASR + NLU
Streaming multilingual recognition
Workflow logic + persona
Role logic + empathy modulation
Context retrieval + evaluation
Domain data fetch + validation
TTS playback
ElevenLabs voice synthesis start
Total
Time (ms)
Edge ingress
30
ASR + NLU
90
Workflow logic + persona
40
Context retrieval + evaluation
40
TTS playback
100
Total
≈300 ms

The result is a system that balances technical precision with emotional depth. Thousands of interviews run concurrently across Indian English, Hindi, and code-mixed speech, each maintaining the rhythm, empathy, and credibility of a real human exchange.


Impact at scale

Result
Mock AI interviews conducted
1.5 million+
Voice minutes
7.5 million+
Average latency
<300 ms
Role–company models
500 million+

अवसर तक पहुँच को समान बनाना

A 24-year-old candidate from Pune shared:

AI इंटरव्यूअर ने मेरा रिज़्यूमे जाना, हिंदी और अंग्रेजी के बीच स्विच किया, और मुझे एक वास्तविक HDFC बैंक पैनल की तरह चुनौती दी। मैंने अगली कोशिश में नौकरी हासिल कर ली।

पहली बार, उम्मीदवार ऐसे इंटरव्यू का अभ्यास कर सकते हैं जो वास्तव में वास्तविक महसूस होते हैं - उनके रिज़्यूमे, कंपनी, और सपनों की भूमिका के लिए अनुकूलित।

Apna की AI इंटरव्यू प्रेप दिखाती है कि वॉइस टेक्नोलॉजी कैसे अवसर को लोकतांत्रिक बना सकती है - लाखों नौकरी चाहने वालों को वही स्तर की तैयारी देना जो कभी कुछ विशेषाधिकार प्राप्त लोगों के लिए आरक्षित था।

कई लोगों के लिए, एक जीवन्त इंटरव्यूअर के साथ अभ्यास करना उनके पहले मानव इंटरव्यू से पहले वास्तविक आत्मविश्वास बनाता है।

वास्तविक समय की आवाज़ को अनुकूली संदर्भ और सहानुभूति के साथ मिलाकर, Apna ने तैयारी को भागीदारी में बदल दिया है - सभी को, चाहे उनकी पृष्ठभूमि या भाषा कुछ भी हो, सफल होने का समान अवसर देना।

सीखने की अगली सीमा को अनलॉक करना

Apna की AI इंटरव्यू प्रेप AI-चालित सीखने और इंटरव्यू की अगली पीढ़ी को परिभाषित करती है।

ElevenLabs टेक्स्ट टू स्पीच API द्वारा संचालित यथार्थवादी, उत्तरदायी आवाज़ें उम्मीदवारों को व्यक्तिगत फीडबैक, प्राकृतिक समय, और द्विभाषी प्रवाह का अनुभव करने देती हैं जो टेक्स्ट-आधारित अभ्यास कभी नहीं दे सकता।

इस सहयोग के माध्यम से, Apna ने परिभाषित किया है कि स्केलेबल लर्निंग कैसी लगती है - यह साबित करते हुए कि वॉइस-आधारित AI मानव अवसर को बढ़ा सकता है, इसे प्रतिस्थापित नहीं कर सकता।

Apna की सफलता दिखाती है कि उच्च-विश्वसनीयता वाली आवाज़ कैसे शिक्षा, रोजगार, और राष्ट्रीय स्तर पर अवसर तक पहुँच को बदल सकती है।

यदि आप कन्वर्सेशनल लर्निंग टूल्स, AI इंटरव्यूअर, या किसी भी सिस्टम का निर्माण कर रहे हैं जहाँ यथार्थवाद और सहानुभूति मायने रखते हैं, तो खोजें कि क्या संभव है ElevenLabs कन्वर्सेशनल एजेंट्स प्लेटफ़ॉर्म के साथ।

ElevenLabs टीम के लेखों को देखें

एजेंट्स प्लेटफ़ॉर्म कहानियाँ
meesho-voice-agent-header

Meesho delivers real-time, multilingual customer support with Conversational AI

लाखों यूज़र्स के लिए हिंदी और अंग्रेज़ी में अद्भुत अनुभवों का विस्तार

एजेंट्स प्लेटफ़ॉर्म कहानियाँ
cars24-elevenlabs

कैसे CARS24 वॉइस AI का उपयोग करके भारत के पुरानी कार अनुभव को बदल रहा है

हर महीने 20,000 घंटे की बहुभाषी ग्राहक बातचीत को उपयोगी जानकारी में बदलना

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें