Question 1

Scribe v2 Realtime이란?

Accepted Answer

Scribe v2 Realtime은 라이브 음성 텍스트 변환을 위해 개발된 스트리밍 음성 텍스트 변환 모델입니다. 30개 언어에서 150ms 지연과 93.5% 정확도를 제공하며, FLEURS 벤치마크에서 Gemini Flash 2.5, GPT-4o Mini Transcribe, Deepgram Nova 3보다 뛰어난 성능을 보입니다.

Question 2

Scribe v2 Realtime과 Scribe v2의 차이점은?

Accepted Answer

Scribe v2 Realtime은 150ms 지연의 스트리밍에 최적화되어 있습니다. Scribe v2(배치)는 녹음된 오디오용으로, 화자 분리, 동적 오디오 태깅, 99개 언어 지원 등 추가 기능이 있습니다. 실시간 에이전트 및 라이브 앱에는 Realtime을, 후처리 워크플로에는 배치 모델을 사용하세요.

Question 3

실시간 음성 텍스트 변환에서 Scribe의 정확도는 어느 정도인가요?

Accepted Answer

Scribe v2 Realtime은 99개 언어에서 최고 수준의 정확도를 제공하며, 까다로운 오디오 환경, 억양, 녹음 품질에도 강합니다. 이전 세대 모델과 주요 API보다 공개 벤치마크에서 더 뛰어난 성능을 보입니다.

Question 4

지연 시간은 어떻게 되나요?

Accepted Answer

애플리케이션 및 네트워크 지연을 제외하고 약 150ms의 엔드 투 엔드 지연. 이는 GPT-4o Mini Transcribe(500ms)보다 3배 빠릅니다.

Question 5

음수 지연/예측 음성 변환이란?

Accepted Answer

Scribe는 다음 단어나 구두점을 실제로 말하기 전에 예측합니다. 덕분에 침묵을 기다리지 않고도 텍스트 변환을 확정할 수 있어 더욱 부드러운 실시간 결과를 제공합니다.

Question 6

어떤 언어를 지원하나요?

Accepted Answer

자동 언어 감지로 90개 이상의 언어 지원. 대화 중 언어 전환도 별도 설정 없이 처리합니다.

Question 7

어떤 오디오 포맷을 지원하나요?

Accepted Answer

8kHz~48kHz 샘플레이트의 PCM 오디오와 μ-law 인코딩 지원. 전화, 브라우저, 스튜디오 소스와 호환됩니다.

Question 8

Scribe v2 Realtime에서 화자 분리(스피커 다이어리제이션)를 지원하나요?

Accepted Answer

현재는 지원하지 않습니다. 다중 화자 식별이 필요하다면 최대 48명까지 지원하는 Scribe v2(배치)를 이용하세요.

Question 9

동시 처리 제한은 어떻게 되나요?

Accepted Answer

비즈니스 요금제에서 30개 이상의 동시 스트림 지원. 엔터프라이즈 요금제는 더 높은 한도 제공. 대량 사용은 영업팀에 문의하세요.

Question 10

Scribe v2 Realtime이 ElevenLabs Agents에서 사용 가능한가요?

Accepted Answer

네, Scribe v2 Realtime은 기본적으로 Agents 플랫폼에 통합되어 있습니다.

Question 11

어떤 컴플라이언스 인증을 지원하나요?

Accepted Answer

SOC 2, ISO 27001, PCI DSS 1레벨, HIPAA, GDPR 지원. 엔터프라이즈 요금제는 무보관 모드와 EU/인도 데이터 보관도 가능합니다.

실시간 음성 텍스트 변환 API

Scribe v2 Realtime으로 라이브 음성 텍스트 변환

속도와 정확성을 위한 설계

최고 정확도의 실시간 음성 텍스트 변환

모든 상황에 맞춘 설계

실시간 성능을 위해 개발된 음성 인식

Agents와 음성 앱을 위한 맞춤 설계

저지연을 위한 예측 음성 변환

음성 활동 감지

수동 커밋 제어

다양한 오디오 포맷 지원

모든 용도에 최적화된 모델

Scribe v2

Scribe v2 실시간

90개 이상의 언어와 다양한 억양의 음성 텍스트 변환

세계 최고의 기업과 브랜드가 선택한 기술

프로덕션 환경을 위한 API

엔터프라이즈급 데이터 보호

Python 및 TypeScript SDK

고급 지원 및 맞춤형 배포

필요에 맞춘 유연한 요금제

자주 묻는 질문

최신 업데이트