Scribe v2 RealtimeがElevenLabs Agentsで利用可能に

最終更新日 2026年3月14日 • 3 分で読めます

Lauren Rothwell, Growth

エージェント向けに最適化された超低遅延ストリーミングのスピーチtoテキストモデルがAgentsプラットフォームで利用可能になりました。

詳細を見る営業へのお問い合わせ

超低遅延

今週、

Scribe v2 Realtime transcribes speech in under 150ms with state-of-the-art accuracy, enabling agents to respond as naturally as humans do in conversation.

実際の会話のために設計

ほとんどのスピーチtoテキストシステムは、クリーンなテスト環境では良好に動作しますが、現実のノイズの多い背景、多様なアクセント、名前やメール、IDなどの識別子に直面すると苦労します。

Scribe v2 Realtimeは、まさにこれらの課題に対応するように訓練されました。

音質が悪く、多様なアクセントやフィラーが含まれる数百の英語会話サンプルを用いた内部ベンチマークで、Scribe v2 Realtimeは他のリアルタイムASRモデルよりも正確にユーザーの意図を捉えました。

以下は、異なる環境でScribe v2 Realtimeの文字起こし精度をテストした実際の例です。

00:00 / 00:00

多言語対応の精度でリード

スペイン語、ポルトガル語、ヒンディー語など多くの言語でエージェントを展開しているグローバル企業として、Scribe v2 Realtimeが地域を超えて最先端のパフォーマンスを維持することが重要でした。

30言語にわたる精度を測定するFLEURS多言語ベンチマークで、Scribe v2 Realtimeは低遅延ASRモデルの中で最も低い単語誤り率（WER）を達成しました。

これにより、企業は速度や精度を犠牲にすることなく、即座に正確に応答する多言語エージェントを展開できます。

ElevenLabs Agentsで利用可能

Scribe v2 RealtimeはElevenLabs Agentsに完全に統合されており、高度な設定セクションで有効にできます。

ElevenLabsチームによる記事をもっと見る

ElevenAgents Stories

Beam improves access to social services with ElevenAgents

Frontline teams save 20% of their time and phone staff cut workload in half.

Customer Stories

Tutore deploys conversational agents for corporate language training using ElevenLabs

90% of Tutore’s placement interviews are now conducted by AI agents, accelerating onboarding and reducing costs

最高品質のAIオーディオで創造する

営業に連絡サインアップ