Apna alcança 7,5 milhões de minutos de entrevistas com IA usando ElevenLabs

Criando entrevistas simuladas realistas para milhões de candidatos a emprego em toda a Índia

Apna Blog 1x1.

A preparação para entrevistas na Índia sempre foi problemática - genérica, desconectada e inacessível para a maioria dos candidatos.

Apna, a principal plataforma de busca de empregos e carreiras da Índia, decidiu mudar isso, fazendo com que cada entrevista simulada parecesse real - personalizada para cada cargo, empresa e candidato.

Com mais de 60 milhões de usuários e 10.000+ empresas em mais de 30.000 cargos, a visão da Apna exigia mais do que módulos de treinamento. Exigia conversação - com tempo realista, empatia e profundidade de domínio - em grande escala.

Para alcançar isso, a Apna desenvolveu um dos ecossistemas de entrevistas com IA mais avançados, impulsionado pela ElevenLabs Text to Speech and Blue Machines’ voice orchestration platform. Together, these systems have delivered over 1.5 million AI interviews, totaling 7.5 million voice minutes, with sub-300 ms latency.

Por que a Apna escolheu a ElevenLabs

Para que as simulações de entrevista pareçam naturais, a qualidade e a resposta da voz são inseparáveis. Qualquer atraso audível ou tom robótico quebra a imersão e a confiança.

A Apna escolheu a ElevenLabs por três razões principais:

  • Desempenho de streaming de baixa latência - as respostas começam a ser reproduzidas em 150–180 ms.
  • Capacidade multilíngue - síntese perfeita entre inglês indiano, hindi e fala mista.
  • Nuance emocional - modulação de tom que reflete empatia e desafio humanos.

Essas qualidades permitem que a Apna preserve o ritmo de uma conversa real enquanto mantém a credibilidade emocional em escala.

Orquestrando realismo humano em tempo real em escala

Para tornar essas entrevistas realistas possíveis, a Apna teve que resolver um desafio complexo de orquestração. Oferecer uma entrevista simulada que pareça real exige mais do que um diálogo roteirizado; requer precisão sincronizada entre voz, latência, empatia e contexto – tudo operando em harmonia na velocidade da máquina.

Cada empresa entrevista de maneira diferente. O papel de um gerente de produto pode ser testado em raciocínio de métricas; o papel de um oficial de crédito bancário em lógica de conformidade; e um líder de plataforma de e-commerce em otimização de rotas.

Nos bastidores, a plataforma de orquestração da Apna, Blue Machines, construiu um gráfico de Geração Aumentada por Recuperação (RAG) para cada interseção de função × empresa:Blue Machines built a Retrieval-Augmented Generation (RAG) graph for each role × company intersection: 

● 10 000 + empresas × 50–100 cargos = ~500 milhões de micro-modelos.
● Cada modelo ancorado em rubricas, tom e vocabulário específicos da empresa.

They integrated ElevenLabs’ streaming TTS directly into its conversational loop. Each turn begins with candidate speech, processed by multilingual ASR and NLU models, followed by workflow logic that evaluates intent, emotional tone, and role-specific context. The system then retrieves relevant domain data, composes the next question, and plays it back through ElevenLabs — all within roughly 300 milissegundos de ponta a ponta.

“Cada resposta sintetizada começa a ser reproduzida em ~150–180 ms, graças às APIs de baixa latência da ElevenLabs integradas diretamente na camada de orquestração da Apna e Blue Machines”, disse Abhishek Ranjan, CTO, Apna

At 300 ms, the human brain perceives speech as continuous rather than delayed - the threshold where realism begins. 

Function
Edge ingress
Regional gateways + smart routing
ASR + NLU
Streaming multilingual recognition
Workflow logic + persona
Role logic + empathy modulation
Context retrieval + evaluation
Domain data fetch + validation
TTS playback
ElevenLabs voice synthesis start
Total
Time (ms)
Edge ingress
30
ASR + NLU
90
Workflow logic + persona
40
Context retrieval + evaluation
40
TTS playback
100
Total
≈300 ms

The result is a system that balances technical precision with emotional depth. Thousands of interviews run concurrently across Indian English, Hindi, and code-mixed speech, each maintaining the rhythm, empathy, and credibility of a real human exchange.


Impact at scale

Result
Mock AI interviews conducted
1.5 million+
Voice minutes
7.5 million+
Average latency
<300 ms
Role–company models
500 million+

Igualando o acesso à oportunidade

A 24-year-old candidate from Pune shared:

O entrevistador com IA conhecia meu currículo, alternava entre hindi e inglês, e me desafiava como um verdadeiro painel do banco HDFC. Consegui o emprego na minha próxima tentativa.

Pela primeira vez, os candidatos podem praticar entrevistas que parecem realmente reais – adaptadas ao seu currículo, empresa e cargo dos sonhos.

A preparação para entrevistas com IA da Apna mostra como a tecnologia de voz pode democratizar oportunidades - dando a milhões de candidatos o mesmo nível de preparação que antes era reservado para poucos privilegiados.

Para muitos, praticar com um entrevistador realista constrói confiança real antes de sua primeira entrevista humana.

Ao combinar voz em tempo real com contexto adaptativo e empatia, a Apna transformou a preparação em participação - dando a todos, independentemente de origem ou idioma, uma chance igual de sucesso.

Desbloqueando a próxima fronteira do aprendizado

A preparação para entrevistas com IA da Apna define a próxima geração de aprendizado e entrevistas impulsionadas por IA.

Vozes realistas e responsivas, impulsionadas pela API de Text to Speech da ElevenLabs, permitem que os candidatos experimentem feedback personalizado, tempo natural e fluência bilíngue que a prática baseada em texto nunca poderia oferecer.

Por meio desta colaboração, a Apna redefiniu como é o aprendizado em escala - provando que a IA baseada em voz pode expandir oportunidades humanas, não substituí-las.

O sucesso da Apna demonstra como a voz de alta fidelidade pode transformar educação, empregabilidade e acesso a oportunidades em escala nacional.

Se você está desenvolvendo ferramentas de aprendizado conversacional, entrevistadores com IA ou qualquer sistema onde realismo e empatia importam, descubra o que é possível com ElevenLabs Conversational Agents Platform.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade