
Kindred, ElevenLabs와 함께 상징적인 캐릭터에 생명을 불어넣다
- 카테고리
- ElevenAPI 사례
- 날짜
음성 중심 AI로 접근성과 생산성 확장
먼지는 AI 네이티브 엔터프라이즈를 위한 운영체제로, 이제 ElevenLabs 기반의 다국어 음성 입력과 출력을 지원합니다. 일상 업무에 모델을 통합하도록 설계된 Dust는 다양한 언어, 기기, 상황에서 저지연·고현실감의 음성 기능이 필요했습니다.
이것은 단순한 실험이 아니었습니다. 반복적인 고객 요청으로 인해 음성이 제품의 핵심 우선순위가 되었습니다. 그 결과, 출퇴근 중에도 핸즈프리로 에이전트와 상호작용하고, 글로벌 팀 간 다국어 협업이 가능하며, 비동기 워크플로우에 사용할 수 있는 전문적인 오디오 출력 시스템이 완성되었습니다.
Dust는 업무 환경에서 음성에 필요한 네 가지 핵심 요건을 확인했습니다:
OpenAI, Google, Deepgram, AssemblyAI 등 다양한 제공업체를 평가한 끝에, Dust는 뛰어난 품질과 배포 준비도를 갖춘 ElevenLabs를 선택했습니다:
Dust는 두 가지 핵심 워크플로우에 음성 지원을 구축했습니다:
ElevenLabs의 scribe_v1 모델을 사용해, 이제 사용자는 마이크를 통해 에이전트와 대화할 수 있습니다. 시스템이 자동으로 언어를 감지하고, 전사하며, 요청을 적절히 라우팅하고, 자연스러운 말에서 에이전트 이름까지 추론합니다.
음성 입력은 모바일에서도 제공되어, 타이핑이 불편한 순간에도 사용할 수 있습니다.
음성 생성기를 통해 Dust 에이전트는 ElevenLabs의 eleven_multilingual_v2 및 eleven_v3 모델을 활용해 오디오 콘텐츠를 제작할 수 있습니다. 출력물에는 팟캐스트, 브리핑, 내러티브 오디오 자료 등이 포함되며, 내부 활용과 외부 공유 모두에 사용됩니다.
사운드 스튜디오는 음향 효과 생성을 기반으로, 교육 및 콘텐츠 활용 사례에 비언어적 오디오 레이어를 추가합니다.
Dust는 실시간 대화형 음성 에이전트와 전사 그 이상의 오디오 이해, 회의·프레젠테이션 등 장문의 입력 지원을 연구 중입니다. ElevenLabs와의 통합으로 Dust는 음성을 엔터프라이즈 AI의 자연스러운 일부로 만듭니다.



