
처음 만드는 대화형 AI 에이전트: 입문 가이드
- 날짜
대화형 AI는 지원 제공 비용을 낮추고 확장성을 높일 수 있습니다
Stripe는 훌륭한 지원으로 유명하며, 종종 기대 이상의 서비스를 제공합니다. 하지만 훌륭한 지원은 트위터에서 볼 수 있는 손글씨 쪽지나 3D 프린트 토템 그 이상입니다. 10년이 넘는 시간 동안 사람과 소프트웨어 엔지니어링이 결합되어 Stripe는 매년 수백만 개의 비즈니스를 지원하는 고객 서비스 시스템을 구축할 수 있었습니다. 저는 2015년에 Stripe에 합류했는데, 그때 회사 인원은 200명을 막 넘겼고, 지원팀은 한 회의실 테이블에 둘러앉을 수 있을 정도였습니다.
저는 더블린에서 초기에 채용된 인원 중 한 명이었고, Stripe의 글로벌 지원 커버리지의 첫 거점이었습니다. 그곳에서 5년 동안 Stripe는 지원팀을 전문화로 재구성하고, 외부 벤더를 1차 지원으로 도입했으며, 채널을 확장하고, 언어를 추가하고, 결국 유료 지원 플랜도 도입했습니다. 이런 변화하는 지원 프로그램을 설계하고 테스트하는 데 참여하면서, 고객 서비스 확장의 복잡함을 직접 경험했습니다. 이런 복잡함은 대화형 AI가 훨씬 간소화할 수 있었던 부분입니다.
Conversational AI has three elements. These three elements work together seamlessly: Speech-to-Text captures the user’s intent, Language Models interpret and generate intelligent responses, and Text-to-Speech transforms those responses into natural conversation.
Stripe에 입사했을 때, 제 일은 제품을 최대한 많이 익히는 것이었습니다. 교육 과정의 일환으로, 더 경험 많은 상담원을 따라다니며 이전 지원 사례들을 학습했습니다. 이는 AI 에이전트가 학습하는 방식과 비슷합니다.
AI는 패턴 인식에 강하며, 지원 업무의 많은 부분이 바로 패턴 인식입니다. 사용자가 문제를 설명하면, 지원 상담원이 그 정보를 처리해 기존 지식과 매칭하고, 답변을 제공합니다. 하지만 지원은 단순히 지식 베이스를 읊는 것만이 아닙니다. 훌륭한 고객 서비스에는 공감, 창의성, 그리고 사용자의 문제를 함께 해결하는 노력이 필요합니다. 안타깝게도 대부분의 지원 경험은 이런 부분이 부족합니다.
지원은 중요한 접점이지만, 종종 불편합니다. 마지막으로 항공사에 전화했던 때를 떠올려 보세요. 몇 시간 동안 대기하다가 겨우 연결되면, 담당 부서가 아니라며 다시 연결하라는 말을 듣고, 끝없는 반복이 이어집니다.
고객만 힘든 게 아닙니다. 훌륭한 지원 경험을 제공하는 것은 어렵고, 규모가 커질수록 더 어렵습니다. 소프트웨어 중심의 세상에서는 많은 것이 쉽게 확장되지만, 지원은 사람(아톰)에 의해 제한됩니다. 만약 하룻밤 사이에 고객이 대거 몰려온다면, AWS 인스턴스를 늘려 사이트는 쉽게 유지할 수 있지만, 지원 인력을 바로 늘릴 수는 없습니다.
지원 기능을 확장하려면 시간과 비용이 듭니다. 북미 기준, 지원 상담원을 찾고, 교육하고, 온보딩하는 데 약 12,000달러가 필요합니다. 초기 비용을 포함하면, 상담원 1명의 평균 시간당 비용은 약 30~40달러입니다. 일부 기업은 지원을 외주로 맡기기도 하는데, 이 경우 시간당 8~30달러 수준입니다. 겉보기엔 저렴해 보이지만, 그만큼 책임감, 프로세스, 지원 품질에 대한 통제력이 떨어집니다.
몇 분 만에 지원 시스템을 바로 구축하고, 무한대로 확장할 수 있다면 어떨까요? 고품질 지원을 저렴한 비용으로 제공할 수 있다면 어떨까요? 이것이 바로 대화형 AI의 약속입니다. 오랜 시간 지원 업무를 해온 경험으로 볼 때, 정말 혁신적인 변화라고 생각합니다. 대화형 AI의 약속이며, 오랜 기간 지원 업무를 해온 입장에서 정말 혁신적이라고 생각합니다.
Alexis는 ElevenLabs의 AI 지원 에이전트 예시 중 하나입니다. 이 에이전트는 ElevenLabs 문서 내에서 지원 상담원 역할을 하며, 현재 하루에 100건이 넘는 전화를 처리하고 있습니다.
만약 Alexis가 사람이었다면 어떨까요? 대부분의 인간 상담원이 하루 100건의 전화를 처리하는 것은 쉽지 않습니다. 아주 효율적인 상담원이라면 60건 정도, 복잡한 문의나 숙련도가 낮은 경우 40건 정도가 한계일 것입니다. 결국 최소 2명은 채용해야 하고, 초과근무 수당도 필요할 수 있습니다.
상담원이 북미에 있다면, 100건의 전화를 처리하는 데 최소 700달러, 평균 1,719달러, 많게는 4,094달러까지 들 수 있습니다. 비용이 크기 때문에 외주를 고려할 수도 있는데, 이 경우 128~480달러, 평균 288달러 정도입니다. 겉보기엔 훨씬 저렴하지만, 외주 업체를 온보딩하고 관리하는 숨은 비용, 그리고 기준에 미치지 못할 경우 브랜드와 평판 리스크도 있습니다.
| Method | Min. | Avg. | Max. |
|---|---|---|---|
| Human (internal) | 1.40 | 3.44 | 8.19 |
| Human (outsourced) | 0.256 | 0.576 | 0.96 |
| AI | 0.026 | 0.031 | 0.036 |
| Source: thinkhdi.com | |||
AI 지원 에이전트의 오디오 처리 비용은 분당 $0.015까지 낮출 수 있습니다. LLM(대형 언어 모델)은 모델 선택과 지식 베이스 크기에 따라 분당 1센트 미만에서 몇 센트까지 가능합니다. 즉, 100건의 전화를 처리하는 데 약 13~18달러면 충분합니다. 이는 내부 상담원 평균 대비 110배, 외주 대비 18배 저렴한 수준입니다. 객관적으로 봐도 Alexis의 지원 경험은 꽤 훌륭합니다. 이 가격이라면 정말 놀랍죠.
아날로그적인 공급망 분야에서, Traba는 인재를 위한 기술적 다리 역할을 하며, 산업 기업들이 인력을 채용하고 관리할 수 있도록 돕습니다. Traba는 앱과 대시보드를 제공하지만, 종이 근태표와 게시판에 익숙한 현장 인력에게는 여전히 전화가 중요한 소통 수단입니다.
Traba는 운영팀이 가장 많은 시간을 쓰는 전화 유형을 분석했고, 지원 문의 응대와 일정 체크리스트 진행이 대부분을 차지한다는 사실을 발견했습니다. CTO Akshay Buddiga는 자동화가 당연한 해답이라고 생각했지만, 타이밍도 중요하다고 말합니다. “효율화하고 싶은 프로세스를 찾으면, 나중에 솔루션을 억지로 끼워 넣기보다는 초기에 자동화를 도입하는 걸 선호합니다.”
Traba는 단위 경제성과 기술 혁신에서 앞서 나가는 데 집중하고 있어, 이런 전화를 대화형 AI로 전환하는 것이 여러모로 매력적이었습니다. 속도와 비용을 고려해 다양한 솔루션을 검토했지만, 사용자 경험도 중요했습니다. 소프트웨어 엔지니어 Joseph Besgen은 “녹음된 음성을 듣는 느낌이 아니라, 진짜 대화처럼 들리길 원했다”고 말합니다. ElevenLabs의 데모는 너무 자연스러워서, 테스트 중 Traba 직원의 아버지가 AI인지 실제 직원인지 구분하지 못할 정도였습니다.
수천 명의 현장 인력 일정을 잡는 것은 복잡하지만, 의사 진료 예약 한 번 잡는 일은 그렇게 어렵지 않아야 합니다. 하지만 최근에 병원에 전화해 본 적 있으신가요? 환자에게는 답답하고, 의료진의 시간도 비효율적으로 쓰입니다. ElevenLabs와 협력한 EliseAI의 어시스턴트는 의료 행정의 빈틈을 메우며, 예약부터 결제까지 다양한 업무를 처리합니다. 한 병원에서는 이제 전체 전화의 86%를 AI 에이전트가 완전히 처리하고 있습니다. 그 결과, 통화당 비용이 66% 절감되고, 행정 인력의 효율도 높아졌습니다. EliseAI는 영어가 익숙하지 않은 커뮤니티의 의료 접근성도 높였습니다.

섹터별로 대화형 AI의 성장 추이를 살펴보면 흥미로운 트렌드가 나타납니다. 에듀테크(EdTech)는 대화형 AI를 가장 먼저 도입한 산업이었는데, 기업들이 저렴한 비용으로 맞춤형 1:1 튜터링과 언어 학습을 제공할 수 있게 되었기 때문입니다. 이후 고객 지원 분야가 빠르게 뒤따랐습니다. 고객 지원은 패턴 인식이 중요한 영역으로, 답변이 지식 베이스에 존재하고 AI 에이전트가 이를 사용자의 질문과 매칭하는 방식이기 때문에 특히 적합합니다. 물류, 헬스케어 등 특정 산업에 특화된 엔드 투 엔드 애플리케이션도 증가하고 있습니다. 예를 들어 Traba와 EliseAI가 있습니다. 이들 분야 역시 반복적이고 예측 가능한 업무가 많아 AI 에이전트가 쉽게 처리할 수 있습니다.
대화형 AI는 지원을 아톰(사람)에서 비트(디지털) 세계로 옮깁니다. 이제 기업과 고객 모두에게 더 나은 지원 경험을 제공할 수 있습니다. 클라우드처럼, AI 지원팀도 필요에 따라 자유롭게 확장하거나 축소할 수 있습니다. 고객은 더 이상 대기할 필요가 없고, 기업은 전 세계에 지원 센터를 구축하는 번거로움에서 벗어날 수 있습니다.
지난 1년간 음성 에이전트는 대화와 지식 검색에 강점을 보여줬지만, 저는 이것이 시작에 불과하다고 생각합니다. 2025년에는 AI 음성 에이전트가 미팅 예약이나 '제품 전문가' 유형의 지원 업무에서 표준 프로토콜이 될 것입니다. 아직은 지식 검색 위주로 제한될 수 있지만, 이만큼만 해도 지원 업무량이 크게 줄고, 사람은 더 가치 있는 일에 집중할 수 있습니다.
2026년이 되면, 단순히 지식을 찾아주는 단계를 넘어 실제 행동까지 하게 될 것입니다. 표준 AI 음성 에이전트는 API 호출과 외부 앱 연동을 하며, 미팅 예약이나 환불 처리 같은 업무를 일상적으로 수행하게 됩니다.
2027년에는 AI 음성 에이전트가 지원을 넘어 고객 성공까지 담당하게 될 것입니다. 전체 영업 거래가 AI 에이전트에 의해 진행될 수도 있고, 구매자와 판매자 모두 AI가 될 수도 있습니다. 많은 사람들에게는 이것이 마지막 단계처럼 보이겠지만, 저는 오히려 시작이라고 생각합니다. 한때 인간만이 할 수 있다고 여겼던 맥락적이고 창의적인 업무도 점점 AI의 영역이 될 것입니다.
지원은 비용 센터에서 탈피해, 먼저 비용을 상쇄하고, 궁극적으로는 비즈니스의 이익 센터로 바뀔 것입니다. AI 음성 에이전트가 고객에게 먼저 연락해 이탈을 줄이고, 고객 LTV를 높일 수 있습니다. 대화형 AI는 인간 지원의 장점을 대부분 제공하면서도, 완벽한 기억력, 수십 개 언어 지원, 24시간 운영 등 추가적인 이점도 있습니다. 미래는 이미 우리 곁에 와 있습니다. 즉각적이고, 공감하며, 효과적인 지원—매번 경험할 수 있습니다. 곧, 항공사에 전화하는 것도 재미로 해보고 싶어질지도 모릅니다.



