
ElevenLabs, 이제 Kiro Power로 제공
- 카테고리
- ElevenAPI
- 날짜
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Scribe v2는 업계 최고 수준의 전사 정확도를 자랑하며, 다양한 억양이나 어려운 오디오 환경에서도 깔끔하고 편집 가능한 텍스트를 제공합니다.
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
배경 소음, 음악, 강한 억양, 저음질 오디오 등 까다로운 환경에서도 정확하게 전사합니다.
ElevenLabs 음성 인식 API는 웃음, 감정, 음향 효과까지 감지합니다. 주요 용어 프롬프트로 전문 용어도 정확하게 전사할 수 있습니다.
.webp&w=3840&q=95)
.webp&w=3840&q=95)

웃음, 박수, 음악, 배경 소음 등 비음성 이벤트까지 모두 감지. 전사본에 오디오의 전체 맥락이 담깁니다.
최대 48명의 화자를 자동으로 식별 및 라벨링. 누가 무엇을 말했는지 명확하게 구분된 읽기 쉬운 전사본 제공.
이름, 날짜, 장소, 조직 등 56가지 엔터티 유형을 전사본에서 자동으로 감지 및 태깅.
다양한 억양, 방언, 녹음 환경에서도 뛰어난 정확도 제공.
languageCode를 변경해 다양한 언어 미리보기
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // 언어 설정
diarize: true
});
console.log(transcription);“현지 언어로 Reels 더빙부터 Horizon에서 음악 및 캐릭터 음성 생성까지, ElevenLabs 플랫폼은 전 세계 크리에이터, 기업, 엔터프라이즈가 음성, 음악, 사운드로 다양한 창작을 실현할 수 있게 합니다.”
“Scribe의 뛰어난 다국어 정확도 덕분에 Fieldy는 모든 일상 대화를 이해하고, 손쉽게 글로벌 확장이 가능해졌습니다. ElevenLabs Scribe 도입 후 사용자 유지율이 50% 증가했습니다.”
“ElevenLabs 덕분에 강력한 텍스트 음성 변환 기능을 SDK에 빠르게 적용할 수 있었고, Agents가 사용자 질문이나 시각 피드백에 실시간으로 감정이 담긴 음성으로 응답할 수 있게 되었습니다.”

“Twilio는 ElevenLabs의 생성형 AI 음성 기술을 CPaaS에 통합해 ConversationRelay를 강화했습니다. 이 통합으로 기업과 개발자는 Twilio CPaaS 플랫폼에서 바로 사람처럼 자연스럽고 감정이 풍부한 대화형 AI 음성 상호작용을 실시간으로 구현할 수 있습니다. ElevenLabs는 Twilio가 가장 자연스러운 AI 음성으로 ConversationRelay를 강화하는 파트너로 ElevenLabs를 선택해 매우 기쁩니다.”








.webp&w=3840&q=80)
