본문 바로가기

Duvo, ElevenAgents로 단 1주 만에 실사용 보이스 에이전트 배포

엔터프라이즈 대화를 며칠 만에 자동화된 워크플로우로 전환

duvo

첫 API 호출부터 실사용 보이스 에이전트까지 단 1주 – ElevenLabs 스타트업 그랜트 지원

Duvo는 대화를 통제된 자동화 워크플로로 전환해 운영 전반을 관리하는 AI 에이전트를 만듭니다. 비즈니스 사용자가 프로세스를 말로 설명하면 Duvo가 이를 매핑하고, 누락된 부분을 찾아내며, 책임자와 상태, 제어 기능이 포함된 실행 과제로 전환합니다. 이후 이 시스템은 워크플로에 따라 보이스 에이전트를 배포해 공급업체에 전화하고, 납기일을 확인하며, 문서를 수집하고, 엔터프라이즈 시스템을 업데이트합니다.

음성은 Duvo 제품 경험의 핵심입니다. 이를 위해 Duvo는 ElevenAgents를 활용해 첫 API 호출부터 실사용 가능한 보이스 레이어까지 1주 만에 구축했습니다.

1주 만에 실사용 보이스 배포

ElevenAgents의 높은 설정 자유도로 Duvo 엔지니어들은 지연 시간과 스트리밍 동작을 조정하고, 다양한 엔터프라이즈 환경에 맞게 음성 특성을 맞추며, 실시간 오디오 스트리밍이나 인터럽트 관리, 음성 처리 인프라를 따로 구축하지 않고도 워크플로 오케스트레이션에 음성을 바로 통합할 수 있었습니다.

Duvo는 약 8~12주가 걸릴 것으로 예상되던 맞춤형 음성 인프라 구축 대신, 며칠 만에 실사용 가능한 보이스 레이어를 배포했습니다. 이로써 자체적으로 스트리밍 파이프라인, 바지인(barge-in) 처리, 음성 라이프사이클 관리 등을 구현하고 유지할 필요가 없어졌습니다.

음성 중심 엔터프라이즈 제품을 만드는 초기 스타트업에게 이는 수개월의 인프라 작업을 줄이고 운영 리스크도 낮춰줍니다. Duvo는 또한 ElevenLabs 스타트업 그랜트 프로그램 수혜 기업으로, 초기 비용 부담을 줄이고 음성 인프라 대신 오케스트레이션, 거버넌스, 엔터프라이즈 로직에 엔지니어링 역량을 집중할 수 있었습니다.

엔터프라이즈 음성 자동화 실현

대부분의 엔터프라이즈 운영은 여전히 사람 간 대화와 수작업에 의존합니다. 공급업체에 전화하고, 확인을 요청하고, 문서를 수집하는 일 등은 여러 시스템과 팀에 걸쳐 있지만, 제대로 매핑되거나 자동화된 적이 없습니다.

Duvo는 ElevenAgents와 함께 이를 바꿀 두 가지 제품을 만들었습니다.

Duvo Clarity는 실제 워크플로가 어떻게 운영되는지 담당자와의 구조화된 대화를 통해 파악합니다. 한 유럽 식료품 소매업체와의 세션에서 Clarity는 5개 시스템과 3개 팀에 걸친 프로모션 세팅 워크플로를 매핑했고, 2개의 통제 공백과 연간 100만 유로가 넘는 마진 손실(지연된 공급업체 확인 때문)을 찾아냈습니다. 이 과정은 보통 6~8주 걸리는 컨설팅 대신 단 하루 만에 끝났습니다.

이후 Duvo의 자율 보이스 에이전트가 Clarity가 찾아낸 문제를 해결합니다. 이제 구매 담당자가 아침마다 공급업체에 전화를 걸어 납기일을 확인하는 대신, 에이전트가 직접 전화를 걸고, 확인을 받고, 결과를 ERP에 기록합니다.

ElevenAgents를 선택한 이유

별도의 음성 인식(Speech to Text), 언어 모델, 그리고 텍스트 음성 변환(Text to Speech) 시스템을 따로 조합하는 대신, Duvo는 ElevenAgents를 자연스러운 대화를 위한 통합 대화형 레이어로 도입했습니다. ElevenAgents 덕분에 Duvo는 저지연 음성 상호작용을 제공하고, 어색한 멈춤 없이 실시간 턴테이킹을 처리하며, API 기반 워크플로로 음성 스타일과 에이전트 행동을 반복 개선하고, 음성을 단순한 표면 기능이 아닌 오케스트레이션 로직에 직접 녹여낼 수 있었습니다.

처음으로 고객이 자신의 워크플로우를 설명하고, 몇 분 만에 구조화된 프로세스 맵이 돌아오는 걸 봤을 때, 모두가 조용해졌어요. 그때 음성은 단순한 기능이 아니라 인터페이스라는 걸 알았습니다. ElevenLabs 덕분에 그 경험을 단 일주일 만에 제공할 수 있었어요. – Tomas Cupr, CEO, Duvo

다음 단계

AI 오퍼레이터, 보이스 네이티브 엔터프라이즈 툴, 실시간 대화에 기반한 자동화 시스템을 구축하는 팀에게 맞춤형 음성 스택을 직접 개발하고 유지하는 일은 실행 속도를 늦추고 운영 복잡성을 높입니다.ElevenAgents를 활용하면 팀은 즉시 실사용급 대화형 에이전트를 배포하고, 자신만의 차별화된 제품 개발에 집중할 수 있습니다.

시작하려면 ElevenAgents를 살펴보거나 ElevenLabs 스타트업 지원금 프로그램에 신청해보세요.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요