
ElevenCreative Flowsでリアルタイム共同作業が可能に
- カテゴリ
- プロダクト
- 日付
Scribe v2は最も正確な音声からテキストへのモデルです。Scribe v2 Realtimeはライブトランスクリプションの基準を設定し、エージェントやリアルタイムアプリケーションを支えます。どちらもAPIで利用可能です。

Scribe v2 Realtimeは150ms未満でライブ音声をキャプチャし、エージェント、会議、AIエージェントに最適な瞬時の理解を提供します。
Scribe v2 Realtimeは150ms未満の遅延で業界トップの精度を提供し、リアルタイム音声認識の新しい基準を設定します。
音声の開始と終了を自動的に検出し、スムーズなライブ処理のために音声を正確にセグメント化。
アクセント、方言、録音条件に関係なく、優れた精度を提供。
APIを使用してScribe Realtime v2をプロダクトに組み込み。フルストリーミングサポートとコミット制御。



MP4、MOV、MP3、WAVなど、あらゆる形式のオーディオまたはビデオをアップロード。Scribe v2は音声を正確なテキストに自動変換し、キャプション、字幕、編集に対応。
Scribe v2は業界トップのトランスクリプション精度を達成し、困難なオーディオ条件や多様なアクセントでもクリーンで編集可能なテキストを提供します。
最大1000個までの特定の単語や文を選択し、Scribeが文脈に基づいて正確に書き起こします。
笑い声から足音まで、Scribe v2はすべての音イベントにタグを付け、トランスクリプトに完全な文脈を追加。
Scribe v2は、話者ごとに直感的に識別・ラベル付けし、エンティティのタイムスタンプを計算、さらに書き起こしから機密情報を自動でマスキングします。

AI音声からテキストへのトランスクリプションは90以上の言語をサポートしており、言語を選択してオーディオファイルをアップロードするだけです。


