
ElevenLabs, 이제 Kiro Power로 제공
- 카테고리
- ElevenAPI
- 날짜
Scribe v2 Realtime은 까다로운 오디오 환경이나 다양한 억양에서도 약 150ms의 지연과 업계 최고 수준의 음성 텍스트 변환 정확도를 제공합니다.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
배경 소음, 음악, 강한 억양, 저품질 오디오 환경에서도 동작하는 음성 텍스트 변환.
Scribe v1을 기반으로 한 Scribe v2 Realtime은 억양, 어조, 환경을 가리지 않고 약 150ms의 지연과 혁신적인 정확도를 자랑합니다.

Scribe v2 Realtime은 개발자가 대화형 에이전트, 회의 어시스턴트, 음성 애플리케이션을 빠르고 정확하게 만들 수 있도록 설계되었습니다.
Scribe v2 Realtime은 예측 음성 변환을 통해 다음에 올 단어나 구두점을 미리 예측하여 실시간 정확도를 높입니다.
음성의 시작과 끝을 감지해 오디오를 정확하게 구분, 부드럽고 효율적인 실시간 음성 텍스트 변환 제공.
개발자가 언제 텍스트 변환을 확정할지 직접 제어 가능 – 맞춤형 스트리밍 및 세밀한 정확도 조정에 적합.
PCM(8–48 kHz) 및 μ-law 인코딩 지원으로 전화, 브라우저, 스튜디오 환경 모두 호환.
대량 작업에는 Scribe v2, 저지연 작업에는 Scribe v2 Realtime 사용
억양, 방언, 녹음 환경에 상관없이 뛰어난 정확도 제공.
languageCode를 변경해 다양한 언어 미리보기
import { useScribe } from "@elevenlabs/react";
const scribe = useScribe({
modelId: "scribe_v2_realtime",
languageCode: , // 언어 설정
onSessionStarted: () =>
console.log("Session started"),
onPartialTranscript: (data) =>
console.log("Partial:", data.text)
});“현지 언어로 Reels 더빙부터 Horizon에서 음악 및 캐릭터 음성 생성까지, ElevenLabs 플랫폼은 전 세계 크리에이터, 기업, 엔터프라이즈가 음성, 음악, 사운드로 다양한 창작을 할 수 있도록 지원합니다.”
“Scribe의 뛰어난 다국어 정확도 덕분에 Fieldy는 모든 일상 대화를 이해하고 손쉽게 글로벌 확장이 가능해졌습니다. ElevenLabs Scribe로 전환 후 사용자 유지율이 50% 증가했습니다.”
“ElevenLabs 덕분에 강력한 텍스트 음성 변환 기능을 SDK에 빠르게 적용할 수 있었고, Agents가 사용자 질문이나 피드백에 실시간으로 풍부한 음성으로 응답할 수 있게 되었습니다.”

“Twilio는 ElevenLabs의 생성형 AI 음성 기술을 CPaaS에 통합해 ConversationRelay를 강화했습니다. 이 통합으로 기업과 개발자는 Twilio CPaaS 플랫폼에서 바로 사람처럼 자연스럽고 표현력 있는 실시간 대화형 AI 음성 상호작용을 만들 수 있습니다. ElevenLabs는 Twilio가 가장 자연스럽고 인간적인 음성으로 ConversationRelay를 강화하는 파트너로 ElevenLabs를 선택해 매우 기쁩니다.”









.webp&w=3840&q=80)
