
ElevenLabs, 스페인에서 사업 확장
- 카테고리
- 회사
- 날짜
초고속, 초정확, 라이브 음성을 위해 설계. Scribe v2 Realtime은 에이전트, 회의, 대화형 AI에 즉각적인 전사를 제공합니다.
다양한 글로벌 데이터를 학습하고 자연스러운 음성에 맞게 최적화되어, 주요 언어와 억양에서 업계 최고 수준의 단어 오류율을 달성합니다.
오디오를 스트리밍하면 약 150ms 내에 전사 결과를 받아볼 수 있어, 라이브 에이전트, 회의, 대화형 AI에 실시간 이해를 제공합니다.

Scribe v2 Realtime은 속도와 정확도가 중요한 대화형 에이전트, 회의 어시스턴트, 음성 앱을 개발하는 개발자를 위해 맞춤 설계되었습니다.
Scribe v2 Realtime은 90개 언어에서 뛰어난 정확도를 제공하며, 다양한 억양, 방언, 음향 환경도 손쉽게 처리합니다.
PCM(8–48 kHz) 및 μ-law 인코딩을 지원해 전화, 브라우저, 스튜디오 환경 모두에서 호환됩니다.
음성 시작과 종료를 감지해 오디오를 정확하게 분할, 매끄럽고 효율적인 실시간 전사를 지원합니다.
개발자가 전사 완료 시점을 직접 제어할 수 있어, 맞춤형 스트리밍과 세밀한 정확도 조정에 적합합니다.





Scribe v1을 기반으로 한 Scribe v2 Realtime은 억양, 어조, 환경을 가리지 않고 약 150ms의 지연과 혁신적인 정확도를 제공합니다.
Scribe v2 Realtime은 예측 전사를 통해 다음에 올 단어와 문장 부호를 미리 예측해 실시간 정확도를 높입니다.
기술 용어, 의약품, 고유명사 등 복잡한 어휘도 기본 지원합니다.
오디오를 연속적으로 전송하면 실시간으로 전사 결과를 바로 받아볼 수 있습니다. 버퍼링 없이 즉각적인 이해가 가능합니다.
Scribe v2 Realtime은 연결이 재설정되어도 전사를 끊김 없이 이어갑니다.

Natural Speech
Filler words, pauses and emotional cues

Low-quality Audio
Background noise or low-bandwidth audio

Accents
Diverse accents and pronunciations

Domain Terms
Acronyms, brands, financial or medical terms



%20(1).webp&w=3840&q=80)