Scribe v2 Realtimeの紹介

本日、最も正確で低遅延のスピーチtoテキストモデル「Scribe v2 Realtime」を紹介します。150ms未満でライブトランスクリプションを提供します。

Scribe v2 Realtime

Scribe v2 Realtime: ライブトランスクリプションに最も正確なモデル

Scribe v2 Realtimeは低遅延の新しい基準を設定します

ライブユースケース向けに設計—

Scribe v2 Realtime benchmark

Scribe v2 Realtimeはエージェントユースケース向けに特別に構築されています。バックグラウンドノイズや複雑な情報を含む500の難しいサンプルで、他のすべてのモデルを大幅に上回ります。

主な特徴

  • ネガティブレイテンシー: 次の単語と句読点の予測
  • 自動言語検出: どの言語でも話せ、会話中に言語を切り替え可能
  • テキストコンディショニング:Scribe v2 Realtimeは前のバッチに基づいてトランスクリプションを続行し、接続再開時に便利
  • ボイスアクティビティ検出 (VAD)
  • 手動コミット:トランスクリプトセグメントを確定するタイミングを完全に制御
  • 複数のオーディオフォーマット:PCM (48kHz) と μ-law エンコーディングをサポート
  • エンタープライズ対応 SOC 2、ISO 27001、PCI DSS L1、HIPAA、GDPR準拠、EUとインドのデータレジデンシーオプション、機密作業負荷に対するゼロ保持モード

Scribe v2 Realtimeはリアルタイムで人間レベルの理解を提供し、ライブ環境で自然な会話と即時の応答を可能にします。Scribe v2 Realtimeは、30の一般的に使用されるヨーロッパおよびアジアの言語で93.5%の精度を達成します。

APIで構築

Scribe v2 Realtimeは本日ElevenLabs APIを通じて利用可能です。

ドキュメントを探索:https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

ElevenLabsエージェントでScribe v2 Realtimeを使用

Scribe v2 Realtimeを搭載した自然で人間らしいエージェントを展開。サポート、営業、またはプロダクト内体験のためのボイスアシスタントを構築し、リアルタイムで理解し応答します。

詳細はこちら:https://elevenlabs.io/agents

Scribe v2 Realtime for Agents

今日から構築を開始

APIを通じて、またはElevenLabsエージェント内で直接Scribe v2 Realtimeを使用。

こちらからサインアップ:https://elevenlabs.io/app/sign-up

ElevenLabsチームによる記事をもっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン