
Eleven Turbo v2.5 출시
- 카테고리
- 연구
- 날짜
Scribe v2는 대량 전사, 자막, 캡션 작업을 위해 설계되었습니다. Scribe v1보다 안정성과 정확성이 향상되었으며, 긴 오디오, 일시정지, 톤 변화, 긴 침묵 구간도 더 잘 처리합니다.

Scribe v2 Realtime은 초저지연 및 에이전트(agents) 환경에 최적화되어 있지만, Scribe v2는 길고 복잡한 녹음에 최적화되어 다양한 화자, 억양, 전달 방식에서도 정확도를 유지합니다. 그 결과, 실제 다양한 오디오 환경에서도 항상 신뢰할 수 있는 전사 결과를 제공합니다.
Scribe v2는 업계 표준 벤치마크에서 가장 낮은 단어 오류율을 기록했습니다.

키텀 프롬프트는 기존의 커스텀 단어(Custom Vocabulary)보다 한 단계 더 나아가 전사 내용의 문맥을 활용합니다. 최대 100개의 단어나 구를 선택하면, Scribe v2가 해당 용어를 언제 전사할지 정확하게 판단합니다. 기술 분야, 브랜드명, 업계 특화 용어에 특히 적합합니다.

Scribe v2에는 구조화된 오디오 분석을 위한 기본 엔터티 감지 기능이 포함되어 있습니다.
개인 식별 정보, 건강 데이터, 결제 정보 등 최대 56개 카테고리를 선택할 수 있습니다. Scribe v2는 전사본에서 해당 항목과 정확한 타임스탬프를 자동으로 감지하여, 대규모 민감 정보 검토, 삭제, 처리 작업을 쉽게 할 수 있습니다.
API 문서에서 자세히 알아보기:https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection
Scribe v2는 기본적으로 스마트 다국어 워크플로우를 지원합니다.
하나의 오디오 파일에 여러 언어가 포함되어 있어도 전송할 수 있습니다. 모델이 각 언어를 자동으로 감지하고, 별도의 분할이나 설정 없이 정확하게 전사합니다.
Scribe v2에는 엔터프라이즈 및 개발자 환경을 위한 다양한 기능이 포함되어 있습니다:
Scribe v2는 이제 ElevenLabs Studio에서 더 정확한 자막, 캡션, 전사에 사용됩니다. 마케팅, 미디어, 연구, 교육, 컴플라이언스 등 다양한 분야에서 대규모 오디오 및 비디오 라이브러리를 관리하는 팀을 지원합니다.

지금 바로 체험해보세요:https://elevenlabs.io/app/studio
Scribe v2를 통해 개발자와 기업은 복잡한 오디오 파이프라인을 자동화하고, 글로벌 콘텐츠 워크플로우의 정확도를 높이며, 완벽한 컴플라이언스와 데이터 레지던시 제어로 안전하게 확장할 수 있습니다.

Scribe v2는 오늘부터 API와 Creative 플랫폼에서 이용할 수 있습니다.
지금 바로 체험해보세요:https://elevenlabs.io/app/speech-to-text
문서 보기:https://elevenlabs.io/docs/capabilities/speech-to-text
여기에서 가입하기:https://elevenlabs.io/speech-to-text