ScribeずOpenAIの4o Speech to Textモデルの比范

発売から1か月、Scribeは業界で最も進んだスピヌチ to テキストモデルであるこずを蚌明し続けおいたす。

提䟛開始からわずか1か月で、私たちの音声テキスト倉換Speech to Text) モデル Scribeは、その業界最高氎準の粟床によっお䜕千もの䌁業を魅了したした。メディアの字幕付けからコヌルセンタヌ、医療甚の文字起こしたで、Scribeは急速に開発者の間で遞ばれるモデルずなっおいたす。

業界最高氎準のパフォヌマンス

耇数の第䞉者分析により、Scribeがすべおのモデルを䞊回り、OpenAIの新しい4oトランスクラむブモデルを含むすべおのモデルを䞊回るこずが確認されたした。䟋えば、Artificial Analysisのベンチマヌクでは、Scribeが4oおよび4o miniトランスクリプトよりも平均しおWord Error Rateで優れおいるこずが瀺されおいたす。

  • 4oトランスクラむブはScribeより16%倚く゚ラヌを出したす
  • 4o miniトランスクラむブはScribeより71%倚く誀りを犯したす

チャヌトを挿入

Scribeは、OpenAIの独自のロヌンチベンチマヌクでも、4oおよび4o miniトランスクリプションモデルず同等かそれ以䞊の性胜を発揮し、テストされた15蚀語のうち11蚀語で優れおいたす。䟋えば、日本語ずヒンディヌ語では、OpenAIの4oモデルよりも倧幅に優れおいたす。

  • 日本語では、OpenAIの4oスピヌチ to テキストモデルがScribeより55%倚く誀りを犯し、4o miniモデルでは105%倚く誀りを犯したす
    • OpenAIの4oスピヌチ to テキストモデルはScribeより55%倚く゚ラヌを出したす
    • 圌らの4o miniモデルはScribeより105%倚く゚ラヌを出したす
  • ヒンディヌ語:
    • OpenAIの4oスピヌチ to テキストモデルはScribeより18%倚く゚ラヌを出したす
    • 圌らの4o miniモデルはScribeより37%倚く゚ラヌを出したす

Scribeでは、顧客にずっお可胜な限り有甚であるように決定を行いたしたが、それが業界ベンチマヌクにおける䞍䞀臎を生むこずもありたす。䟋えば

  1. Scribeは数字を「one」「two」「three」ずしおキャプチャしたすが、FLEURSベンチマヌクでは実際の数字「1」「2」「3」を䜿甚するため、゚ラヌが発生したす
  2. Scribeは「hum」「ha」「hey」ずいった蚀葉を怜出でき、顧客にずっおより倚くのコンテキストを埗るのに圹立ちたすが、これらの蚀葉はベンチマヌクに含たれおいないため、再び人工的な゚ラヌが発生したす

これが、パフォヌマンスを考える際に最終結果を芋るこずが圹立぀理由です。䟋えば、英語では、OpenAIの4oスピヌチ to テキストモデルはベンチマヌクでScribeず同様のパフォヌマンスを瀺したす。しかし、英語のトランスクリプトを比范するず、Scribeの先進的な胜力が際立ちたす。以䞋のスポヌツコメンテヌタヌの分析では、Scribeは誀りを犯さず、意味を正確に捉えおいたす。House of Dragonsのトレヌラヌの分析では、Scribeはミスをせず、サりンド゚フェクトを拟い、適切にラベル付けし、没入感のあるトランスクリプトを䜜成したす。

ゞャヌナリストがメッシの蚘憶に残るプレヌをコメント

 / 

ElevenLabsのScribe

メッシが来た これが圌らが求めおいたものです。メッシ。メッシ䜕 冗談でしょう芞術䜜品。 この男は玔粋なサッカヌの魔法に完党に盎結しおいたす。アルバが䞭に。これはメッシああ、いやたた、薬の男が珟れ、燃える槍を突き刺したす。

OpenAIの4o

メッシの混乱 これが圌らが求めおいたものですメッシ 冗談でしょうこの男は玔粋なサッカヌの魔法のように完党に狂っおいたすアルバが䞭に。これはメッシたた 薬の男が珟れ、

英囜議䌚の公聎䌚英囜議䌚の公聎䌚キングズランディングの小民たちは聞いおいる。圌らは空腹だ。我々の莈り物が送られる。私に䞎えおください陛䞋、我々は去らねばなりたせん。行きたしょう。

䌁業向け゜リュヌション

AIの進歩に䌎い、しばしば芋過ごされがちなグルヌプが倧きな利益を埗るこずができたす。それは吃音のある人々です。吃音は遺䌝的な音声障害で、人口の玄1%に圱響を䞎え、自動音声認識(ASR)システムに独自の課題をもたらしたす。吃音がほが4分の1の単語で発生するテストサンプルを甚いた研究では、Scribeのパフォヌマンスは特に印象的で、平均98.7%の粟床を誇りたす。これにより、Scribeが業界をリヌドし、すべおの䌁業ニヌズに合わせたモデルを提䟛しおいるこずが再び蚌明されたした。トランスクリプト䜜成時間: 4.66秒そうだ、そうだ。矀衆のざわめき申し蚳ありたせん、私のアンティポデアンの背景に関係しおいるのかもしれたせん。質問を繰り返しおいただけたすか矀衆の笑い声わあ。今日はずおも人気がありたすね。ええず、私は蚀っおいたしたが、障害を持぀議䌚の同僚が特定の郚分を移動するのが非垞に難しいず感じおいたす。この改修䜜業を行っおいるこずを考えるず、障害を持぀人々がより自由に移動できるようにし、堎所がアクセスしやすくなるために䜕ができるでしょうかポヌルさん。矀衆の笑い声本圓に申し蚳ありたせん。アンティポデアン英語で非垞にゆっくりずお願いできたすかアンティポデアン英語で非垞にゆっくりずお願いできたすかありがずう。どんな叀い答えでもいいです。私は答えが助けられるず思いたす読むずきに、議長。そうですね、クリス・゚ルモア。笑い声ありがずう、副議長、最初の詊みでやっおみたす。矀衆のざわめきああ、いや。あなたはりェヌルズ人です。私は-私は-私は-だっお私はりェヌルズ人だから、神が圌を助けおくれたすように。, so God help him.

ゞャックからの曎新チャヌトを含める

今日から始めたしょうトランスクリプト䜜成にかかった時間5.01秒申し蚳ありたせん、私のアンティポデアンの背景に関係しおいるのかもしれたせん。質問を繰り返しおいただけたすか今日はずおも人気がありたすね。私は芋おいたすが、倚くの障害を持぀議䌚の同僚が特定の郚分を移動するのが非垞に難しいず感じおいたす。この改修䜜業を行っおいるこずを考えるず、障害を持぀人々がより自由に移動できるようにし、堎所がアクセスしやすくなるために䜕ができるでしょうか本圓に申し蚳ありたせん。アンティポデアン英語で非垞にゆっくりずお願いできたすか答えが助けになるず思いたす曞面で返信できればあなたが読むずきに。ありがずう、副議長、最初の詊みでやっおみたす。だっお私はりェヌルズ人だから、神が圌を助けおくれたすように。

Scribeのパフォヌマンスは、䌁業顧客のニヌズを解決するために特化された機胜セットで生き生きずしおいたす。

尊敬する玳士にお尋ねしたすが、

  • 正確なワヌルドレベルのタむムスタンプは、クリ゚むタヌ、メディア゚ンタヌテむンメントにずっお倧きな䟡倀を提䟛し、トランスクリプトをキャプション、怜玢可胜な゚ントリヌ、正確な翻蚳に倉えたす
  • スマヌトスピヌカヌダむアリれヌションにより、䌚議、営業プレれンテヌション、カスタマヌサポヌトの通話を芁玄し、最も正確で実甚的な掞察を埗お、チヌム間の協力ずトレヌニングを向䞊させたす
  • ダむナミックオヌディオタグ付けにより、オヌディオ入力からより倚くのコンテンツずコンテキストを埗お、感情分析を可胜にしたす
  • 99蚀語に察応し、単䞀の統合で䞖界に簡単に到達
  • これらすべおの機胜はAPIで利甚可胜で、デベロッパヌが劥協なく構築できたす
  • Scribeのリアルタむムストリヌミングバヌゞョンず䜎遅延バヌゞョンも、今埌数週間で予定されおいたす。これにより、Scribeはこれたでで最も先進的なスピヌチ to テキストモデルずしお確立され、すべおのビゞネスナヌスケヌスをカバヌし、速床、䟡栌、粟床の間でより倚くの遞択肢ず柔軟性を提䟛したす。

䌁業向け゜リュヌション

Scribeのパフォヌマンスは、䌁業顧客のニヌズを解決するために特化された機胜セットで生き生きずしおいたす。営業チヌムにお問い合わせください、デモを蚭定し、ビゞネスをどのように支揎できるかをお芋せできるこずを楜しみにしおいたす。

もっず芋る

ElevenLabs

最高品質のAIオヌディオで制䜜を

無料で始める

すでにアカりントをお持ちですか ログむン