본문 바로가기

지원 분야의 대화형 AI 현황

대화형 AI로 지원 비용을 절감하고 확장성을 높일 수 있습니다

Over-ear headphones with sound wave graphics on a dark blue background.

Stripe는 훌륭한 지원으로 유명하며, 종종 기대 이상의 서비스를 제공합니다. 하지만 훌륭한 지원은 트위터에서 볼 수 있는 손글씨 메모나 3D 프린트 토템 그 이상입니다. 10년이 넘는 인력과 소프트웨어 엔지니어링을 통해 Stripe는 매년 수백만 개의 비즈니스를 지원하는 고객 서비스 시스템을 구축했습니다. 저는 2015년에 Stripe에 합류했는데, 그때는 직원이 200명 정도였고 지원팀도 한 회의실 테이블에 둘러앉을 수 있을 정도였습니다.

저는 더블린에서 초기에 채용된 인원 중 한 명이었고, Stripe의 글로벌 지원 커버리지의 초기 거점이었습니다. 5년 동안 Stripe는 지원팀을 전문화로 재구성하고, 외부 벤더를 1차 지원으로 도입했으며, 채널을 확장하고, 언어를 추가하고, 결국 유료 지원 플랜도 도입했습니다. 이런 변화하는 지원 프로그램을 설계하고 테스트하는 데 참여하면서, 고객 서비스 확장의 복잡함을 직접 경험했습니다. 이런 복잡함은 대화형 AI가 훨씬 간소화할 수 있었던 부분입니다.

대화형 AI
Conversational AI Diagram

대화형 AI는 세 가지 요소로 구성됩니다. 이 세 가지 요소가 매끄럽게 함께 작동합니다: 음성 인식(Speech-to-Text)으로 사용자의 의도를 파악하고, 언어 모델(Language Models)이 이를 해석해 지능적인 답변을 생성하며, 텍스트 음성 변환(Text-to-Speech)으로 그 답변을 자연스러운 대화로 바꿉니다.

  • 음성 인식(Speech to Text): AI의 귀가 사용자의 자연스러운 음성을 높은 정확도로 텍스트로 변환합니다.
  • 언어 모델(Language Models): AI의 두뇌가 이 텍스트를 처리하고 맥락을 이해해 지능적인 답변을 생성합니다.
  • 텍스트 음성 변환(Text to Speech): AI의 목소리가 텍스트 답변을 자연스러운 음성으로 변환합니다.
  • 턴테이킹(Turn Taking): 전용 서비스가 끼어들기를 감지하고 대화가 자연스럽고 사람처럼 느껴지도록 관리합니다.

Stripe에 입사했을 때, 저의 역할은 제품을 최대한 많이 익히는 것이었습니다. 교육 과정의 일환으로 더 경험 많은 에이전트를 따라다니며, 이전 지원 사례들을 학습했습니다. 이는 AI 에이전트가 학습하는 방식과 비슷합니다.

AI는 패턴 인식에 강하며, 지원 업무의 많은 부분도 패턴 인식입니다. 사용자가 문제를 설명하면, 지원 에이전트가 그 정보를 처리하고 기존 지식과 매칭해 답변을 제공합니다. 하지만 지원은 단순히 지식 베이스를 읊는 것만이 아닙니다. 훌륭한 고객 서비스에는 공감, 창의성, 그리고 사용자의 문제를 함께 해결하는 노력이 필요합니다. 안타깝게도 대부분의 지원 경험은 부족한 경우가 많습니다.

지원의 현주소

지원은 중요한 접점이지만, 종종 불편하게 느껴집니다. 최근에 항공사에 전화해본 적이 있나요? 몇 시간 동안 대기하다가 겨우 연결되면, 담당 부서가 아니라며 다시 연결하라는 말을 듣고, 끝없는 반복이 이어집니다.

고객만 힘든 게 아닙니다. 훌륭한 지원 경험을 제공하는 것은 어렵고, 규모가 커질수록 더 어렵습니다. 소프트웨어 중심의 세상에서 지원은 여전히 물리적 제약을 받습니다. 만약 갑자기 고객이 대거 몰려온다면, AWS 인스턴스를 추가해 사이트는 쉽게 확장할 수 있지만, 지원은 스위치 하나로 바로 늘릴 수 없습니다.

지원 기능을 확장하려면 시간과 비용이 듭니다. 북미 기준으로 지원 에이전트를 찾고, 교육하고, 온보딩하는 데 약 12,000달러가 필요합니다. 초기 비용을 포함하면, 지원 에이전트 1명의 평균 비용은 시간당 약 30~40달러입니다. 일부 기업은 지원 에이전트를 외주로 맡기기도 하는데, 시간당 8~30달러 수준입니다. 겉보기엔 저렴해 보이지만, 그만큼 책임감, 프로세스, 지원 품질에 대한 통제력이 떨어집니다.

하지만 만약 몇 분 만에 지원을 시작하고, 무한대로 확장할 수 있다면 어떨까요? 저렴한 비용으로 고품질 지원이 가능하다면요? 이것이 바로 대화형 AI의 약속입니다. 오랜 기간 지원 업무를 해온 입장에서, 저는 이것이 완전히 판을 바꾼다고 생각합니다. 대화형 AI의 약속이며, 오랜 기간 지원 업무를 해온 입장에서 정말 혁신적이라고 생각합니다.

Alexis는 ElevenLabs의 AI 에이전트 예시 중 하나입니다. 지원 에이전트로 개발되어 ElevenLabs 문서 내에서 현재 하루에 100건이 넘는 전화를 처리하고 있습니다.

만약 Alexis가 사람이었다면 어떨까요? 대부분의 지원 에이전트가 하루에 100건의 전화를 처리하는 것은 쉽지 않습니다. 아주 효율적인 에이전트라면 60건 정도, 보통은 40건 정도가 한계일 것입니다. 결국 최소 2명을 채용해야 하고, 초과 근무 수당도 필요할 수 있습니다.

만약 에이전트가 북미에 있다면, 100건의 전화를 처리하는 데 최소 700달러, 평균 1,719달러, 최대 4,094달러까지 들 수 있습니다. 비용이 크기 때문에 외주를 고려할 수도 있습니다. 이 경우 128~480달러, 평균 288달러로 훨씬 저렴해 보이지만, 외주 업체를 온보딩하고 관리하는 숨은 비용과, 기준에 미치지 못할 경우 브랜드 및 평판 리스크도 존재합니다.

Method Min. Avg. Max.
Human (internal) 1.40 3.44 8.19
Human (outsourced) 0.256 0.576 0.96
AI 0.026 0.031 0.036
출처: thinkhdi.com

AI 지원 에이전트 운영 비용은 오디오 기준 분당 $0.015까지 낮출 수 있습니다. LLM은 모델 선택과 지식 베이스 크기에 따라 분당 1센트 미만에서 몇 센트까지 가능합니다. 즉, 100건의 전화를 처리하는 데 약 $13~18 정도가 듭니다. 이는 평균 내부 에이전트보다 110배, 평균 외주 에이전트보다 18배 저렴합니다. 객관적으로 봐도 Alexis의 지원 경험은 꽤 훌륭합니다. 이 가격대라면 정말 놀랍죠.

대화형 AI의 실제 적용

아날로그가 주를 이루는 공급망 분야에서, Traba는 인재를 위한 기술적 다리 역할을 하며, 산업 기업들이 근로자를 채용하고 관리할 수 있도록 돕습니다. Traba는 앱과 대시보드를 제공하지만, 종이 근무표와 게시판에 익숙한 근로자들에게는 여전히 전화가 중요한 소통 수단입니다.

Traba는 운영팀이 가장 많은 시간을 쓰는 전화 유형을 분석했고, 지원 문의 응대와 일정 체크리스트 진행이 대부분을 차지한다는 사실을 발견했습니다. CTO Akshay Buddiga는 자동화가 당연한 해답이라고 생각했지만, 타이밍도 중요하다고 말합니다. “효율화하고 싶은 프로세스를 찾으면, 나중에 솔루션을 억지로 끼워 넣기보다는 초기에 자동화를 도입하는 걸 선호합니다.”

Traba는 단위 경제성과 기술 혁신에서 앞서 나가는 데 집중하고 있기 때문에, 이런 전화를 대화형 AI로 전환하는 것이 여러모로 매력적이었습니다. 속도와 비용을 고려해 다양한 솔루션을 검토했지만, 사용자 경험도 중요했습니다. 소프트웨어 엔지니어 Joseph Besgen은 “녹음된 음성을 듣는 느낌이 아니라, 진짜 대화처럼 들리길 원했다”고 말합니다. ElevenLabs의 데모는 너무 자연스러워서, 테스트 중 Traba 직원의 아버지가 AI인지 실제 직원인지 구분하지 못할 정도였습니다.

수천 명의 경공업 근로자 일정을 잡는 것은 복잡하지만, 사실 의사 진료 예약 한 번 잡는 일은 그렇게 어렵지 않아야 합니다. 하지만 최근에 병원에 전화해본 적 있나요? 환자에게는 답답하고, 의료진의 시간도 비효율적으로 쓰입니다. ElevenLabs와의 협업을 통해, EliseAI의 어시스턴트가 의료 행정의 빈틈을 메우고, 예약부터 청구까지 모든 업무를 처리하고 있습니다. 한 병원에서는 이제 86%의 전화가 AI 에이전트에 의해 완전히 처리됩니다. 그 결과, 통화당 비용이 66% 절감되고, 행정 인력의 효율성도 높아졌습니다. EliseAI는 영어가 모국어가 아닌 커뮤니티의 의료 접근성도 높였습니다.

미래 전망

Graph showing state of Conversational AI across industry sectors

분야별 대화형 AI 성장세를 보면 흥미로운 트렌드가 보입니다. EdTech(교육 기술)는 대화형 AI를 가장 먼저 도입한 산업이었습니다. 기업들이 저렴한 비용으로 1:1 맞춤 튜터링과 언어 학습을 제공할 수 있게 되었기 때문입니다. 고객 지원 분야도 빠르게 뒤따랐는데, 지원 업무는 패턴 인식이 중요한 영역이기 때문입니다. 답은 지식 베이스에 있고, AI 에이전트가 이를 사용자의 질문과 매칭합니다. 물류, 헬스케어 등 특정 산업에 특화된 엔드투엔드 솔루션도 늘고 있습니다. Traba와 EliseAI가 대표적입니다. 이런 분야는 반복적이고 예측 가능해 AI 에이전트가 쉽게 처리할 수 있습니다.

대화형 AI는 지원을 아톰(사람)에서 비트(디지털) 세계로 옮깁니다. 이제 기업과 고객 모두에게 더 나은 지원 경험을 제공할 수 있습니다. 클라우드처럼, AI 지원팀도 필요에 따라 자유롭게 확장하거나 축소할 수 있습니다. 고객은 더 이상 대기할 필요가 없고, 기업은 전 세계에 지원 센터를 구축하는 번거로움에서 벗어날 수 있습니다.

지난 1년간 음성 에이전트는 대화와 지식 검색에 강점을 보여왔지만, 저는 이것이 시작에 불과하다고 생각합니다. 2025년에는 AI 음성 에이전트가 미팅 일정 잡기나 '제품 전문가' 유형의 지원 이슈에 대한 표준 프로토콜이 될 것입니다. 비록 지식 검색 위주로 제한될 수 있지만, 지원 업무의 상당 부분을 줄이고, 사람 팀이 더 가치 있는 일에 집중할 수 있게 해줄 것입니다.

2026년에는 단순히 지식을 찾아주는 것을 넘어 실제 행동까지 하게 될 것입니다. 표준 AI 음성 에이전트가 API 호출을 하고, 외부 앱과 연동하며, 미팅 예약이나 환불 처리 같은 업무를 일상적으로 수행할 것입니다.

2027년에는 AI 음성 에이전트가 지원을 넘어 고객 성공까지 담당하게 될 것입니다. 전체 영업 거래가 AI 에이전트에 의해 진행될 수도 있고, 구매자와 판매자 모두 AI가 될 수도 있습니다. 많은 사람들에게는 이것이 마지막 경계처럼 보이지만, 저는 오히려 시작이라고 생각합니다. 한때 인간만이 할 수 있다고 여겼던 맥락적이고 창의적인 업무도 점점 AI의 영역이 될 것입니다.

지원은 비용 센터에서 탈피해, 먼저 비용을 상쇄하고, 궁극적으로는 비즈니스의 이익 센터로 변모할 것입니다. AI 음성 에이전트가 고객에게 먼저 연락해 이탈을 줄이고, 고객 LTV를 높입니다. 대화형 AI는 인간 지원의 장점을 대부분 제공하면서도, 완벽한 기억력, 수십 개 언어 지원, 24시간 운영이라는 강점을 갖고 있습니다. 미래는 이미 다가오고 있습니다. 언제든 즉각적이고 공감하며 효과적인 지원을 받을 수 있는 세상—곧 항공사에 전화하는 게 즐거워질지도 모릅니다.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요