
Scribe v2がアップグレードされました
- カテゴリ
- デベロッパー
- 日付
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Scribe v2は業界最高水準の文字起こし精度を実現。難しい音声環境や多様なアクセントでも、きれいで編集しやすいテキストを出力します。
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
ノイズ環境やBGM、強いアクセント、低音質でも正確に文字起こし。
ElevenLabsのトランスクリプションAPIは、笑い声や感情、サウンドエフェクトを検出できます。キータームプロンプトを使って、専門用語を含む文字起こしをガイドできます。
.webp&w=3840&q=95)
.webp&w=3840&q=95)

笑い声、拍手、音楽、バックグラウンドノイズなどの非音声イベントもキャプチャ。文字起こしには、単語だけでなく音声全体の文脈が含まれます。
最大48人まで自動で話者を識別・ラベル付け。誰が何を話したかを明確にし、読みやすい文字起こしにまとめます。
名前、日付、場所、組織など56種類のエンティティを自動で識別・タグ付けします。
アクセントや方言、録音環境を問わず高精度な文字起こしを実現。
languageCodeを変更して各言語をプレビュー
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // 言語を設定
diarize: true
});
console.log(transcription);“Reelsの多言語吹き替えから、Horizonでの音楽やキャラクターボイス生成まで、ElevenLabsプラットフォームは世界中のクリエイターや企業が音声・音楽・サウンドを大規模に活用できる環境を提供しています。”
“Scribeの圧倒的な多言語精度のおかげで、Fieldyは日々の会話をすべて理解し、グローバル展開も簡単に。ElevenLabs Scribe導入後、ユーザー定着率が50%向上しました。”
“ElevenLabsのおかげで、強力なテキスト読み上げ機能をSDKにすぐ組み込めました。エージェントがユーザーの質問や状況にリアルタイムで表情豊かな声で応答できます。”

“TwilioはElevenLabsの生成AI音声技術をCPaaSに統合し、ConversationRelayを強化しました。この連携により、企業やデベロッパーはTwilio CPaaS上で、人間らしく表現力豊かでリアルタイムな会話型AI音声インタラクションを実現できます。ElevenLabsとしても、Twilioが最も表現力豊かな人間らしい音声でConversationRelayを強化するパートナーにElevenLabsを選んでくださったことを嬉しく思います。”









