
Meesho delivers real-time, multilingual customer support with Conversational AI
Skalar otroliga upplevelser för miljontals användare på hindi och engelska
Skapar mänskligt realistiska övningsintervjuer för miljontals arbetssökande i hela Indien
Intervjuberedskap i Indien har länge varit bristfällig - generell, osammanhängande och otillgänglig för de flesta arbetssökande.
Apna, Indiens ledande plattform för jobbsök och karriärer, bestämde sig för att ändra detta genom att få varje övningsintervju att kännas som en riktig - anpassad till varje roll, företag och kandidat.
Med över 60 miljoner användare och 10 000+ företag över 30 000+ roller krävde Apnas vision mer än träningsmoduler. Det krävde konversation - livlik timing, empati och djup inom området - i massiv skala.
För att uppnå detta skapade Apna ett av de mest avancerade AI-intervjusystemen, drivet av ElevenLabs Text to Speech and Blue Machines’ voice orchestration platform. Together, these systems have delivered over 1.5 million AI interviews, totaling 7.5 million voice minutes, with sub-300 ms latency.
För att intervjusimuleringar ska kännas naturliga är röstkvalitet och responsivitet oskiljaktiga. Varje hörbar fördröjning eller robotliknande ton bryter immersion och förtroende.
Apna valde ElevenLabs av tre huvudskäl:
Dessa egenskaper gör att Apna kan bevara rytmen i verkliga samtal samtidigt som de upprätthåller emotionell trovärdighet i stor skala.
För att göra dessa verklighetstrogna intervjuer möjliga behövde Apna lösa en komplex orkestreringsutmaning. Att leverera en låtsasintervju som känns äkta kräver mer än skriptad dialog; det kräver synkroniserad precision i röst, latens, empati och kontext – allt i harmoni med maskinhastighet.
Varje företag intervjuar på sitt sätt. En produktchef kan testas på metrikresonemang; en bankkredittjänsteman på efterlevnadslogik; och en e-handelsplattformledare på ruttoptimering.
Bakom kulisserna byggde Apnas orkestreringsplattform, Blue Machines, en Retrieval-Augmented Generation (RAG) graf för varje roll × företagskorsning:Blue Machines built a Retrieval-Augmented Generation (RAG) graph for each role × company intersection:
● 10 000 + företag × 50–100 roller = ~500 miljoner mikromodeller.
● Varje modell förankrad i företagsspecifika riktlinjer, ton och ordförråd.
They integrated ElevenLabs’ streaming TTS directly into its conversational loop. Each turn begins with candidate speech, processed by multilingual ASR and NLU models, followed by workflow logic that evaluates intent, emotional tone, and role-specific context. The system then retrieves relevant domain data, composes the next question, and plays it back through ElevenLabs — all within roughly 300 millisekunder från början till slut.
“Varje syntetiserat svar börjar spelas upp inom ~150–180 ms, tack vare ElevenLabs’ låg-latens-API:er integrerade direkt i Apna och Blue Machines’ orkestreringslager”, sa Abhishek Ranjan, CTO, Apna
At 300 ms, the human brain perceives speech as continuous rather than delayed - the threshold where realism begins.
The result is a system that balances technical precision with emotional depth. Thousands of interviews run concurrently across Indian English, Hindi, and code-mixed speech, each maintaining the rhythm, empathy, and credibility of a real human exchange.
A 24-year-old candidate from Pune shared:
AI-intervjuaren kände till mitt CV, växlade mellan hindi och engelska, och utmanade mig som en riktig HDFC-bankpanel. Jag klarade jobbet vid nästa försök.
För första gången kan kandidater öva på intervjuer som känns verkligt äkta – anpassade till deras CV, företag och drömroll.
Apnas AI Interview Prep visar hur röstteknologi kan demokratisera möjligheter - ge miljontals arbetssökande samma nivå av förberedelse som tidigare var reserverad för ett privilegierat fåtal.
För många bygger övning med en livliknande intervjuare verkligt självförtroende inför deras första mänskliga intervju.
Genom att kombinera röst i realtid med anpassningsbar kontext och empati har Apna förvandlat förberedelse till deltagande - ge alla, oavsett bakgrund eller språk, en lika chans att lyckas.
Apnas AI Interview Prep definierar nästa generation av AI-drivet lärande och intervjuande.
Realistiska, responsiva röster drivna av ElevenLabs Text to Speech API låter kandidater uppleva personlig feedback, naturlig timing och tvåspråkig flyt som textbaserad övning aldrig kunde erbjuda.
Genom detta samarbete har Apna omdefinierat hur skalbart lärande låter - bevisar att röstbaserad AI kan utöka mänskliga möjligheter, inte ersätta dem.
Apnas framgång visar hur högkvalitativ röst kan transformera utbildning, anställningsbarhet och tillgång till möjligheter i nationell skala.
Om du bygger konversationsbaserade lärverktyg, AI-intervjuare eller något system där realism och empati är viktiga, upptäck vad som är möjligt med ElevenLabs Conversational Agents Platform.

Skalar otroliga upplevelser för miljontals användare på hindi och engelska

Omvandla 20 000 timmar av flerspråkiga kundsamtal varje månad till användbara insikter
Drivs av ElevenLabs Agenter