ベンチマーク
世界で最も正確なASRモデルで、99以上の言語に対応しています。

他のASRモデルと比較したベンチマークによると、Scribeは主要な言語で98%以上の文字起こし精度を提供し、これまで十分に対応されてこなかった言語(セルビア語、広東語、マラヤーラム語など)ではエラーを大幅に減少させています。
Scribeは99の言語で各単語を正確にキャプチャし、キャラクターレベルのタイムスタンプ、話者の識別、オーディオイベントのタグ付けを行います。統合や編集に適した構造化されたトランスクリプトを提供します。
MP4、MOV、MP3、WAVなどのビデオやオーディオをアップロード。Scribeが音声を正確なテキストに自動変換し、キャプション、字幕、編集に対応します。
再録音せずにミスを修正したりナレーションを洗練したりできます。トランスクリプトを直接編集すると、Scribeがオーディオを更新し、ビデオやポッドキャストの制作を効率化します。
Scribeを使用して、あなたの音声を完璧なテキストに変換しましょう。Scribeは、世界で最も先進的な自動音声認識(ASR)モデルで、最も簡単な音声文字変換のAPI統合を提供します。
かつてない精度を実現—Scribeは業界で最も低い誤字率を提供し、完璧なテキスト変換を実現します。
どんな会話でも、たとえ忙しいものであっても、Scribeは直感的にすべての話者を区別しラベル付けし、明確で整理されたトランスクリプトを提供します。
各単語が話される正確な瞬間をキャプチャし、シームレスな字幕同期とインタラクティブなオーディオ体験を実現します。
笑い声から足音まで、Scribeのテキスト変換モデルはすべての音声イベントにタグを付け、音声の完全な文脈でトランスクリプトを豊かにします。
99の言語に対応し、言語の壁を打破—Scribeは、これまで手が届かなかった言語に対してAIによる文字起こしの機能を解放します。
バックグラウンドノイズ、リバーブ、不要な音を除去してクリーンな対話を実現。AIボイスチェンジャーでナレーターの声を瞬時に変更します。
世界で最も正確な音声テキスト変換モデルをアプリケーションにシームレスに統合します。話者識別、文字単位のタイムスタンプ、音声イベントのタグ付けなどの機能を紹介する、開発者に優しいサンプルを使って始めましょう。これにより、完璧な文字起こしが実現します。
Scribe V1の性能はFLEURSベンチマークで最先端です
Scribe V1の性能はCommon Voiceベンチマークで最先端です
ベンチマーク
他のASRモデルと比較したベンチマークによると、Scribeは主要な言語で98%以上の文字起こし精度を提供し、これまで十分に対応されてこなかった言語(セルビア語、広東語、マラヤーラム語など)ではエラーを大幅に減少させています。
私たちのAIによる音声からテキストへの変換は99の言語に対応しています。言語を選択し、音声ファイルをアップロードするだけです。