
ElevenLabs AI 음성, 살바도르 달리의 목소리를 초현실적으로 되살리다
- 카테고리
- 고객 사례
- 날짜
Jamie, 맞춤형 파이프라인을 ElevenLabs Scribe로 교체해 정확도 향상과 3배 빠른 속도 달성
제이미는 회의 요약과 핵심 인사이트를 제공하는 AI 어시스턴트입니다. 팀은 대화 요약, 액션 아이템 추출, 결정 사항 강조를 위해 맞춤형 LLM 파이프라인을 구축했습니다.
정확한 전사 결과를 얻기 위해 주요 음성 인식(Speech-to-Text, STT) 제공업체를 모두 테스트했지만, 전사와 화자 분리 모두 기준에 미치지 못했습니다. 결국 오픈소스 모델을 조합해 직접 파이프라인을 만들었고, 유지 관리에는 많은 엔지니어링 리소스가 필요했습니다.
이 상황은 ElevenLabs 스크라이브 출시로 달라졌습니다. Jamie는 바로 Scribe를 테스트했고, 결과는 명확했습니다. Scribe는 겹치는 발화, 끼어드는 말, 비언어적 오디오 이벤트까지 다른 모델보다 더 잘 처리했습니다. 통합에는 며칠밖에 걸리지 않았고, 별도의 커스터마이징도 거의 필요하지 않았습니다. Scribe로 전환하면서 Jamie는 엔지니어링 부담을 크게 줄이고 전사 품질도 높일 수 있었습니다.
변경 후 즉각적인 비즈니스 효과가 있었습니다. 화자 오류에 대한 불만이 사라졌고, 전사 속도는 3배 빨라졌습니다. 1시간짜리 회의도 이제 30~45초 만에 처리됩니다. 덕분에 사용자는 더 빠르게 '아하' 순간을 경험할 수 있었고, 활성화율과 사용자당 회의 기록 수도 모두 증가했습니다.
Scribe는 영어, 독일어, 스페인어, 네덜란드어 등 다양한 언어에서도 동일한 결과를 보여줬습니다.
"Scribe로 업그레이드한 후 제품 품질이 크게 향상됐습니다. 까다로운 오디오 환경에서도 미묘한 대화 흐름까지 정확하게 포착할 수 있어, 고객 만족도와 회의 인사이트 모두 좋아졌습니다."
— Egor Spirin, meetjamie.ai 제품 및 엔지니어링 총괄
Scribe는 높은 전사 및 화자 분리 정확도를 기본으로 제공하면서도 경쟁력 있는 가격을 갖춘 최초의 모델입니다. Jamie는 더 이상 복잡한 파이프라인을 유지할 필요가 없습니다. Scribe 덕분에 운영이 간소화되고, 모든 사용자가 더 나은 제품 경험을 누릴 수 있게 됐습니다.





