
Meesho delivers real-time, multilingual customer support with Conversational AI
Ampliando experiências incríveis para milhões de usuários em hindi e inglês
Criando entrevistas simuladas realistas para milhões de candidatos a emprego em toda a Índia
A preparação para entrevistas na Índia sempre foi problemática - genérica, desconectada e inacessível para a maioria dos candidatos.
Apna, a principal plataforma de busca de empregos e carreiras da Índia, decidiu mudar isso, fazendo com que cada entrevista simulada parecesse real - personalizada para cada cargo, empresa e candidato.
Com mais de 60 milhões de usuários e 10.000+ empresas em mais de 30.000 cargos, a visão da Apna exigia mais do que módulos de treinamento. Exigia conversação - com tempo realista, empatia e profundidade de domínio - em grande escala.
Para alcançar isso, a Apna desenvolveu um dos ecossistemas de entrevistas com IA mais avançados, impulsionado pela ElevenLabs Text to Speech and Blue Machines’ voice orchestration platform. Together, these systems have delivered over 1.5 million AI interviews, totaling 7.5 million voice minutes, with sub-300 ms latency.
Para que as simulações de entrevista pareçam naturais, a qualidade e a resposta da voz são inseparáveis. Qualquer atraso audível ou tom robótico quebra a imersão e a confiança.
A Apna escolheu a ElevenLabs por três razões principais:
Essas qualidades permitem que a Apna preserve o ritmo de uma conversa real enquanto mantém a credibilidade emocional em escala.
Para tornar essas entrevistas realistas possíveis, a Apna teve que resolver um desafio complexo de orquestração. Oferecer uma entrevista simulada que pareça real exige mais do que um diálogo roteirizado; requer precisão sincronizada entre voz, latência, empatia e contexto – tudo operando em harmonia na velocidade da máquina.
Cada empresa entrevista de maneira diferente. O papel de um gerente de produto pode ser testado em raciocínio de métricas; o papel de um oficial de crédito bancário em lógica de conformidade; e um líder de plataforma de e-commerce em otimização de rotas.
Nos bastidores, a plataforma de orquestração da Apna, Blue Machines, construiu um gráfico de Geração Aumentada por Recuperação (RAG) para cada interseção de função × empresa:Blue Machines built a Retrieval-Augmented Generation (RAG) graph for each role × company intersection:
● 10 000 + empresas × 50–100 cargos = ~500 milhões de micro-modelos.
● Cada modelo ancorado em rubricas, tom e vocabulário específicos da empresa.
They integrated ElevenLabs’ streaming TTS directly into its conversational loop. Each turn begins with candidate speech, processed by multilingual ASR and NLU models, followed by workflow logic that evaluates intent, emotional tone, and role-specific context. The system then retrieves relevant domain data, composes the next question, and plays it back through ElevenLabs — all within roughly 300 milissegundos de ponta a ponta.
“Cada resposta sintetizada começa a ser reproduzida em ~150–180 ms, graças às APIs de baixa latência da ElevenLabs integradas diretamente na camada de orquestração da Apna e Blue Machines”, disse Abhishek Ranjan, CTO, Apna
At 300 ms, the human brain perceives speech as continuous rather than delayed - the threshold where realism begins.
The result is a system that balances technical precision with emotional depth. Thousands of interviews run concurrently across Indian English, Hindi, and code-mixed speech, each maintaining the rhythm, empathy, and credibility of a real human exchange.
A 24-year-old candidate from Pune shared:
O entrevistador com IA conhecia meu currículo, alternava entre hindi e inglês, e me desafiava como um verdadeiro painel do banco HDFC. Consegui o emprego na minha próxima tentativa.
Pela primeira vez, os candidatos podem praticar entrevistas que parecem realmente reais – adaptadas ao seu currículo, empresa e cargo dos sonhos.
A preparação para entrevistas com IA da Apna mostra como a tecnologia de voz pode democratizar oportunidades - dando a milhões de candidatos o mesmo nível de preparação que antes era reservado para poucos privilegiados.
Para muitos, praticar com um entrevistador realista constrói confiança real antes de sua primeira entrevista humana.
Ao combinar voz em tempo real com contexto adaptativo e empatia, a Apna transformou a preparação em participação - dando a todos, independentemente de origem ou idioma, uma chance igual de sucesso.
A preparação para entrevistas com IA da Apna define a próxima geração de aprendizado e entrevistas impulsionadas por IA.
Vozes realistas e responsivas, impulsionadas pela API de Text to Speech da ElevenLabs, permitem que os candidatos experimentem feedback personalizado, tempo natural e fluência bilíngue que a prática baseada em texto nunca poderia oferecer.
Por meio desta colaboração, a Apna redefiniu como é o aprendizado em escala - provando que a IA baseada em voz pode expandir oportunidades humanas, não substituí-las.
O sucesso da Apna demonstra como a voz de alta fidelidade pode transformar educação, empregabilidade e acesso a oportunidades em escala nacional.
Se você está desenvolvendo ferramentas de aprendizado conversacional, entrevistadores com IA ou qualquer sistema onde realismo e empatia importam, descubra o que é possível com ElevenLabs Conversational Agents Platform.

Ampliando experiências incríveis para milhões de usuários em hindi e inglês

Transformando 20.000 horas de conversas multilíngues com clientes a cada mês em insights acionáveis
Desenvolvido por ElevenLabs Agentes