본문 바로가기

Apna, ElevenLabs로 750만 분 AI 면접 진행 규모 달성

인도 전역 수백만 구직자를 위한 사람 같은 모의 면접 구축

Apna Blog 1x1.

인도의 면접 준비는 오랫동안 비효율적이고, 형식적이며, 대부분의 구직자에게 접근이 어려웠습니다.

Apna는 인도의 대표적인 구직 및 커리어 플랫폼으로, 모든 모의 면접이 실제 면접처럼 느껴지도록 역할, 회사, 지원자별로 맞춤화해 변화를 만들고자 했습니다.

6천만 명 이상의 사용자와 1만 개 이상의 기업, 3만 개 이상의 역할을 보유한 Apna의 비전은 단순한 교육 모듈만으로는 부족했습니다. 실제와 같은 타이밍, 공감, 그리고 전문성을 갖춘 대화가 대규모로 필요했습니다.

이를 위해 Apna는 ElevenLabs의 텍스트 음성 변환블루 머신즈의 보이스 오케스트레이션 플랫폼을 활용해 가장 진보된 AI 면접 생태계를 구축했습니다. 이 시스템들은 150만 건 이상의 AI 면접, 총 750만 분의 음성 면접을 300ms 이하의 지연 시간으로 제공하고 있습니다.

Apna가 ElevenLabs를 선택한 이유

자연스러운 면접 시뮬레이션을 위해서는 음성 품질과 반응 속도가 필수입니다. 들리는 지연이나 로봇 같은 목소리는 몰입감과 신뢰를 깨뜨립니다.

Apna가 ElevenLabs를 선택한 세 가지 핵심 이유:

  • 저지연 스트리밍 성능 - 150~180ms 내에 응답 재생 시작.
  • 다국어 지원 - 인도식 영어, 힌디어, 혼합 언어까지 자연스럽게 합성.
  • 감정 표현 - 사람의 공감과 도전을 반영하는 톤 조절.

이러한 특징 덕분에 Apna는 실제 대화의 리듬과 감정적 신뢰감을 대규모로 유지할 수 있습니다.

실시간 사람 같은 면접 경험의 대규모 구현

이런 실제 같은 면접을 가능하게 하려면 Apna는 복잡한 오케스트레이션 문제를 해결해야 했습니다. 대본만으로는 부족하며, 음성, 지연, 공감, 맥락이 모두 기계 속도로 정밀하게 맞춰져야 진짜 같은 모의 면접이 완성됩니다.

각 회사마다 면접 방식이 다릅니다. 제품 매니저는 지표 분석을, 은행 신용 담당자는 준수 논리를, 이커머스 플랫폼 리드는 경로 최적화를 평가받을 수 있습니다.

무대 뒤에서는 Apna의 오케스트레이션 플랫폼인 Blue Machines가 역할과 회사별로 Retrieval-Augmented Generation(RAG) 그래프를 구축합니다:

● 1만 개 이상의 회사 × 50~100개 역할 = 약 5억 개의 마이크로 모델
● 각 모델은 회사별 평가 기준, 톤, 용어에 맞춰 설계

Apna는 ElevenLabs의 스트리밍 텍스트 음성 변환을 대화 루프에 직접 통합했습니다. 각 턴은 지원자의 음성으로 시작해 다국어 ASR과 NLU 모델로 처리됩니다. 워크플로우 로직이 의도, 감정, 맥락을 평가하고, 가장 적합한 도메인 데이터를 찾아 다음 질문을 만들고, ElevenLabs를 통해 재생합니다 — 이 모든 과정이 약 300밀리초 내에 완료됩니다.

“각 합성 응답은 약 150~180ms 내에 재생이 시작됩니다. 이는 ElevenLabs의 저지연 API가 Apna와 Blue Machines의 오케스트레이션 레이어에 직접 통합된 덕분입니다.” - Abhishek Ranjan, CTO, Apna

약 300ms 정도면 인간의 뇌는 음성을 지연이 아닌 연속적으로 인식합니다. 이 지점이 진짜 같은 경험의 기준입니다.

Function
Edge ingress
Regional gateways + smart routing
ASR + NLU
Streaming multilingual recognition
Workflow logic + persona
Role logic + empathy modulation
Context retrieval + evaluation
Domain data fetch + validation
TTS playback
ElevenLabs voice synthesis start
Total
Time (ms)
Edge ingress
30
ASR + NLU
90
Workflow logic + persona
40
Context retrieval + evaluation
40
TTS playback
100
Total
≈300 ms

그 결과, 기술적 정밀함과 감정적 깊이를 모두 갖춘 시스템이 완성되었습니다.수천 건의 면접이 인도식 영어, 힌디어, 혼합 언어로 동시에 진행됩니다각 면접마다 실제 사람과 같은 리듬, 공감, 신뢰감을 유지합니다.

대규모 임팩트

Result
Mock AI interviews conducted
1.5 million+
Voice minutes
7.5 million+
Average latency
<300 ms
Role–company models
500 million+

기회의 평등 실현

인도 푸네의 24세 지원자가 이렇게 말했습니다:

AI 면접관이 제 이력서를 알고, 힌디어와 영어를 오가며 실제 HDFC 은행 면접관처럼 저를 평가했습니다. 다음 도전에서 바로 합격했어요.

이제 지원자들은 처음으로 자신의 이력서, 회사, 꿈꾸는 역할에 맞춘 진짜 같은 면접을 연습할 수 있습니다.

Apna의 AI 면접 준비는 음성 기술이 어떻게 기회를 평등하게 만들 수 있는지 보여줍니다. 수백만 구직자에게 소수만 누리던 준비 기회를 제공합니다.

많은 이들이 실제 같은 면접관과 연습하면서 첫 실제 면접 전에 진짜 자신감을 얻고 있습니다.

실시간 음성, 적응형 맥락, 공감을 결합해 Apna는 준비를 참여로 바꿨습니다. 배경이나 언어에 상관없이 모두에게 동등한 성공 기회를 제공합니다.

학습의 새로운 지평을 열다

Apna의 AI 면접 준비는 AI 기반 학습과 면접의 차세대를 제시합니다.

ElevenLabs의 텍스트 음성 변환 API로 구동되는 사실적이고 반응 빠른 음성 덕분에 지원자들은 텍스트 기반 연습으로는 경험할 수 없는 맞춤 피드백, 자연스러운 타이밍, 이중 언어 유창함을 누릴 수 있습니다.

이번 협업을 통해 Apna는 대규모 학습의 새로운 기준을 제시했습니다. 음성 기반 AI가 인간의 기회를 확장할 수 있음을 증명했습니다.

Apna의 성공은 고품질 음성이 교육, 취업, 기회 접근성을 국가 단위로 혁신할 수 있음을 보여줍니다.

대화형 학습 도구, AI 면접관, 혹은 사실감과 공감이 중요한 시스템을 만들고 있다면, ElevenLabs 대화형 에이전트 플랫폼.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요