본문 바로가기

음성 텍스트 변환

가장 정확한 음성 텍스트 변환 모델

Scribe v2는 가장 정확한 음성 텍스트 변환 모델입니다. Scribe v2 Realtime은 실시간 전사에서 새로운 기준을 제시하며, 에이전트와 실시간 애플리케이션에 최적화되어 있습니다. 두 모델 모두 API로 이용할 수 있습니다.

Scribe v2 실시간

Scribe v2 Realtime으로 150ms 이내 실시간 음성 텍스트 변환

Scribe v2 Realtime은 ElevenLabs의 스트리밍 우선 아키텍처를 활용해 90개 이상의 언어로 실시간 음성을 즉시 텍스트로 변환합니다.

Live call
I’m
happy
to
help.
What’s
your
email
address?
It’s
john.doe@me.com
Thanks.
And
your
phone
number?
1-800-404

실시간 음성 전사

Scribe v2 Realtime은 150ms 이내에 실시간 음성을 뛰어난 정확도로 포착합니다. 즉각적인 이해가 필요한 에이전트, 회의, AI 에이전트에 최적화되어 있습니다.

Scribe Realtime이 Gemini, OpenAI, Deepgram 음성 텍스트 변환 모델보다 더 높은 정확도를 보이는 막대 그래프입니다.

높은 정확도와 초저지연

Scribe v2 Realtime은 150ms 이하의 지연과 업계 최고 수준의 정확도를 제공하며, 실시간 음성 인식의 새로운 기준을 제시합니다.

음성 활동 감지

음성 시작과 종료를 자동으로 감지해, 실시간 처리가 더 매끄럽도록 정확하게 구간을 나눕니다.

90개 이상 언어 전사 지원

악센트, 방언, 다양한 녹음 환경에서도 뛰어난 정확도를 제공합니다.

API에서 실시간 지원

API를 통해 Scribe Realtime v2를 제품에 통합하세요. 전체 스트리밍 지원과 커밋 제어 기능 제공.

Scribe v2

Scribe v2로 음성을 텍스트로 변환하고, 자막 생성 및 오디오·비디오 편집까지

팟캐스트, 비디오, 인터뷰 등 다양한 녹음 콘텐츠에 자막, 캡션, 편집 가능한 전사본을 생성하세요. Studio 또는 API를 통해 업계 최고 수준의 정확도를 경험할 수 있습니다.

Amidst the outer atmosphere of the planet Aurora, the sky shimmered with fractured light, as though the planet's veil were made of stained glass suspended in space.
Sensors pulsed with irregular patterns, the kind no algorithm could quite reconcile.
Amidst the outer atmosphere of the planet Aurora, the sky shimmered with fractured light, as though the planet's veil were made of stained glass suspended in space.

오디오 및 비디오 전사

MP4, MOV, MP3, WAV 등 어떤 형식의 오디오나 비디오도 업로드하세요. Scribe v2가 음성을 정확한 텍스트로 자동 변환해 자막, 캡션, 편집에 바로 활용할 수 있습니다.

Scribe v2가 Gemini, OpenAI, Deepgram 음성 텍스트 변환 모델보다 더 높은 정확도를 보이는 막대 그래프입니다.

업계 최고 수준의 전사 정확도

Scribe v2는 업계 최고 수준의 전사 정확도를 자랑하며, 다양한 악센트나 까다로운 오디오 환경에서도 깨끗하고 편집 가능한 텍스트를 제공합니다.

키워드 프롬프트

최대 1,000개의 특정 단어나 문장을 선택하면 Scribe가 맥락에 맞게 정확하게 받아쓰기합니다.

동적 오디오 태깅

웃음부터 발소리까지, Scribe v2가 모든 소리 이벤트를 태깅해 전사본에 풍부한 맥락을 더합니다.

화자 및 엔터티 감지

Scribe v2는 각 화자를 직관적으로 구분하고 라벨링하며, 엔터티 타임스탬프를 계산하고, 전사에서 민감한 정보를 자동으로 가립니다.

스케일에 맞춘 엔터프라이즈급 보안 및 인프라

Foreground

API부터 에이전트까지, 모든 워크플로우에 최적화

음성 텍스트 변환 API 및 SDK

API 또는 SDK를 통해 Scribe v2와 Scribe v2 Realtime을 제품에 통합하세요.

Scribe API code snippet

ElevenLabs Agents

즉각적이고 지연이 거의 없는 실시간 전사로 음성 상호작용을 구현할 수 있습니다.

Agents UI screenshot

ElevenLabs Studio

녹음 파일을 편집 가능한 텍스트, 자막, 다양한 콘텐츠로 변환하세요.

Studio UI mockup

자주 묻는 질문

최신 업데이트

가장 현실적인 보이스 AI 플랫폼