
교육 분야 대화형 음성 AI의 현황
- 카테고리
- 리소스
- 날짜
의대 생활은 정말 쉽지 않습니다.
불과 몇 년 전만 해도 학생들은 두꺼운 교과서와 끝없는 플래시카드를 외우며 하루를 보냈습니다. 하지만 아무리 많은 정보를 머릿속에 집어넣어도, 실제 환자와의 만남을 완벽하게 준비해주는 건 아니라는 아쉬움이 남아 있었습니다.
Sketchy의 창립자들도 그 기분을 너무나 잘 알고 있었습니다. 2013년, 그들 역시 의대생이었고, 미생물학을 더 잘 기억하기 위해 냅킨에 캐릭터를 그려가며 공부했습니다.
그렇게 시작된 냅킨 낙서가 이제는 전 세계 수십만 명의 의대생이 사용하는 시각적 학습 플랫폼으로 성장했습니다.
하지만 임상 교육에서 아무리 뛰어난 그림도 담아낼 수 없는 부분이 있었습니다. 바로 실제 환자와의 대화입니다.
Sketchy가 환자 시뮬레이션을 시도하기 시작했을 때, 목표는 단순히 상황을 재현하는 것이 아니었습니다. 학생들에게 감정적인 반응을 이끌어내는 것이었습니다.환자의 목소리에서 느껴지는 망설임, 미묘한 혼란.임상 지식을 임상적 판단으로 바꿔주는 미묘한 신호들.
바로 그때 ElevenLabs가 등장했습니다.
스케치는 이미 복잡한 의학 지식을 시각적 기억으로 바꿔주는 플랫폼으로 이름을 알렸습니다. 하지만 임상 교육을 더 깊이 파고들면서 한 가지 공백을 발견했습니다.
학생들은 탄탄한 기초 지식을 갖추고 졸업하지만, 임상적 추론, 소통, 공감, 그리고 실제 환자 진료에서 마주치는 불확실성에 대한 연습이 부족했습니다.
OSCE 준비, 실습, 구술 시험은 단순 암기 그 이상을 요구합니다. 유연함과 적극적인 태도가 필요하죠. 플래시카드로는 환자가 처음 질문할 때 어떻게 답해야 할지, 어려운 소식을 전할 때 문화적 뉘앙스를 어떻게 전달해야 할지 배울 수 없습니다.
Sketchy는 이런 순간을 어떻게 시뮬레이션할 수 있을지 고민하기 시작했습니다. 정답은 더 많은 정적인 콘텐츠나 선택지 영상이 아니었습니다. 진짜 대화처럼 느껴져야 했습니다. 실제와 같은 자연스러움과 예측 불가능함이 담겨야 했죠.
“이미 AI로 인터랙티브 케이스를 만들고 있었어요.” Sketchy의 최고 콘텐츠 책임자 벤 뮬러 박사가 말했습니다. “하지만 목소리를 추가하기 전까지는 완전히 사람 같다는 느낌이 들지 않았죠.”
시중에 있는 보이스 모델로 초기 실험을 했을 때는 기대에 못 미쳤습니다. 밋밋한 억양, 기계적인 속도, 감정 없는 목소리. 임상 학습에서는 이런 부분이 정말 중요합니다.
ElevenLabs가 달랐던 점은 억양까지도 실제처럼 들렸다는 것입니다. 이 플랫폼 덕분에 Sketchy는 수십 개 언어로 감정 표현이 풍부한 목소리를 사용할 수 있었고, 속도, 톤, 발음까지 세밀하게 조절할 수 있었습니다.

초기 도전 과제 중 하나는? 바로 온도였습니다. 말 그대로요.
“보이스 모델이 ‘98 °F’를 ‘나인티 에잇 디그리즈... 에프’라고 읽더라고요.” 뮬러 박사가 회상했습니다. 해결책은 발음 가이드를 위한 음소 사전을 만드는 것이었습니다. 작은 기술적 디테일이지만, 임상 대화에서는 이런 정확성이 중요합니다.
ElevenLabs가 도입되자마자 학생 경험이 즉각적으로 달라졌습니다.
환자 시뮬레이션이 더 이상 대본을 읽는 배우처럼 들리지 않고, 실제 병동에서 나눌 법한 대화처럼 느껴지기 시작했습니다. Sketchy는 ElevenLabs를 활용해 망설임, 따뜻함, 단호함, 혼란 등 다양한 성격을 가진 캐릭터의 목소리를 디자인했습니다. 각각의 목소리는 특정 임상 상황에 맞게 맞춤 제작되었습니다.
천식 케이스를 연습하는 학생은 걱정이 많은 엄마가 빠르게 질문하는 상황을 겪을 수 있습니다. 또 다른 케이스에서는 증상을 조용히 축소해서 말하는 10대 환자를 만날 수도 있습니다. AI 에이전트들은 실제 사람처럼 자연스럽게 반응하며, 상황에 맞게 목소리 톤을 조절했습니다.
곧이어 압도적으로 긍정적인 피드백이 쏟아지기 시작했습니다:
“정말 재미있었어요… 더 많은 케이스가 기대돼요.”
“환자의 성격과 실제 같은 대화가 정말 마음에 들었어요.”
학생들은 단순히 배우는 것을 넘어, 실제와 같은 인터랙티브 연습을 통해 진짜로 연결되고 있었습니다. 이것이 바로 Sketchy가 처음 만들어진 이유이기도 합니다.
Sketchy는 단순히 새로운 것을 시도하려고 했던 게 아닙니다. 콘텐츠와 제품팀은 보이스 인터랙션이 학생들의 자신감, 기억력, 장기적 준비도에 어떤 영향을 주는지 꼼꼼하게 테스트했습니다. 그 결과는 매우 고무적이었습니다.
수동적인 객관식 문제 대신 능동적인 대화를 도입하자, 학생들은 무엇을 말할지뿐만 아니라 어떻게 말할지도 연습할 수 있었습니다.
형식이 인터랙티브하다 보니, 팀은 학생들이 어디서 멈추고, 어디서 망설이며, 얼마나 빨리 적응하는지도 분석할 수 있었습니다.
Sketchy에게 이런 인사이트는 추상적인 것이 아니었습니다. 바로 다음 시뮬레이션 설계에 반영되어, 교육 콘텐츠와 AI 로직 모두를 발전시키는 선순환 구조를 만들었습니다.
비즈니스 관점에서도 ElevenLabs 도입은 합리적이었습니다.
보이스 AI 인터랙션은 특히 몰입감 있고 반복 가능한 학습 방식을 원하는 기관들에게 확실한 차별점이 되었습니다. 목소리가 들어간 케이스는 학습자의 집중도를 높이고, 더 자주 다시 찾게 만듭니다(팀이 주의 깊게 추적하는 지표입니다).
하지만 진짜 가치는 숫자로 측정하기 어려웠습니다. 학생들은 시뮬레이션을 통해 더 잘 준비될 뿐만 아니라, 더 호기심 많고, 스스로 돌아보고, 다시 도전하며 성장하려는 태도를 갖게 되었습니다.
이렇게 능동적이고 자기주도적이며 인간 중심적인 학습으로의 전환은 쉽게 만들어지는 것이 아닙니다. 하지만 적절한 보이스 기술이 Sketchy에게 그 가능성을 열어주었습니다.
Sketchy는 이제 보이스 AI를 일회성 혁신이 아닌, 미래 플랫폼의 핵심 축으로 보고 있습니다.
이미 새로운 활용 사례가 개발 중이며, 임상 지식을 넘어 윤리, 팀워크, 갈등 해결 등 다양한 상황까지 확장되고 있습니다.
진단 AI 도구가 발전함에 따라, Sketchy 팀은 그 역할이 계속 진화할 것으로 기대합니다. 앞으로는
정확한 진단을 내리는 훈련만으로는 충분하지 않습니다. AI 결과를 해석하고, 불확실성을 관리하며, 환자에게 명확하고 공감 있게 위험을 전달하는 방법도 가르쳐야 합니다.
이런 맥락에서 인간적인 연결이 경쟁력이 됩니다.
그리고 목소리, 진짜 같고 완벽하지 않은, 인간다운 목소리가 중심 역할을 합니다.
Sketchy가 에듀테크 업계 동료들에게 전하고 싶은 한 가지 교훈이 있다면, 바로 이것입니다. 이미 있는 것을 단순히 디지털화하지 마세요.AI로 이전에는 불가능했던 것을 만들어보세요.
보이스 AI 덕분에 학생의 말을 끊는 환자, 예상치 못한 감정, 환자 케이스에 감정적 영향을 주는 캐릭터 등 새로운 시뮬레이션이 가능해졌습니다. 이것은 단순한 장식이 아니라, 학생들이 실제 세상을 헤쳐나갈 수 있도록 훈련하는 도구입니다. 선형적으로 짜여진 시나리오가 아니라요.
Sketchy의 CEO Girish Krishnaswamy는 이렇게 말했습니다. “목표는 강사를 대체하거나 공감을 자동화하는 것이 아니었습니다. 교육자에게 슈퍼파워를 주고, 학생들에게 잊지 못할 학습 경험을 선사하는 것이었죠.”


.webp&w=3840&q=80)
