SPEECH TO TEXT(音声テキスト変換)

世界で最も正確なASRモデルで音声を文字起こし、キャプション作成、編集

Scribeで99言語における業界トップの文字起こし精度を実現。文字起こしを超えて、自動生成キャプション、ビデオ整合、テキストベースの編集、APIとStudioのシームレスな統合を提供します。

スピーカー 1
Quick
check-in.
Maple
Street
is
a
mess.
Time
to
fix
it.
スピーカー 2
Totally.
Some
of
those
potholes
could
swallow
a
small
car.
スピーカー 1
Or
a
very
brave
skateboarder.
スピーカー 2
We
start
next
week.
Jonas,
four-week
timeline?
スピーカー 3
Yep,
unless
the
concrete
throws
a
tantrum.
スピーカー 1
I'll
handle
flyers,
maybe
toss
in
a
joke.
"Maple
Street,
soon
less
bumpy."
スピーカー 2
Perfect.
Keep
it
simple
and
positive.
スピーカー 3
And
no
squirrels
on
sight,
please.
スピーカー 1
Agreed.
Let's
roll.
Thanks,
team.
The world's most accurate ASR model by IIElevenLabs.

完璧に捉えられたすべての言葉

Scribeは99の言語で各単語を正確にキャプチャし、キャラクターレベルのタイムスタンプ、話者の識別、オーディオイベントのタグ付けを行います。統合や編集に適した構造化されたトランスクリプトを提供します。

Transcribe audio and video

ビデオとオーディオの文字起こし

MP4、MOV、MP3、WAVなどのビデオやオーディオをアップロード。Scribeが音声を正確なテキストに自動変換し、キャプション、字幕、編集に対応します。

Captions and Subtitles

キャプションと字幕の自動生成

ワンクリックで任意のビデオにキャプションを作成。YouTube、TikTokなどの多言語字幕を生成し、アクセシビリティとリーチを向上させます。

Voiceovers

テキスト編集でボイスオーバーを編集

再録音せずにミスを修正したりナレーションを洗練したりできます。トランスクリプトを直接編集すると、Scribeがオーディオを更新し、ビデオやポッドキャストの制作を効率化します。

Timeline

精密なタイムラインエディター

対話、バックグラウンドミュージック、サウンドエフェクトをビデオに合わせて調整。タイムラインエディターを使用して、オーディオを正確に配置します。

アプリの強力な音声テキスト変換機能

Scribeを使用して、あなたの音声を完璧なテキストに変換しましょう。Scribeは、世界で最も先進的な自動音声認識(ASR)モデルで、最も簡単な音声文字変換のAPI統合を提供します。

Sirius software interface with gradient color bar, labeled "II Scribe V1," "Gemini 2.0 Flash," and "Whisper Large v3" on a black background.

業界トップクラスの精度

かつてない精度を実現—Scribeは業界で最も低い誤字率を提供し、完璧なテキスト変換を実現します。

Three glowing, multicolored circular shapes on a black background.

スマートスピーカーによる話者識別

どんな会話でも、たとえ忙しいものであっても、Scribeは直感的にすべての話者を区別しラベル付けし、明確で整理されたトランスクリプトを提供します。

Audio level meter with red and white bars, showing levels around 1:00.

正確なワードレベルのタイムスタンプ

各単語が話される正確な瞬間をキャプチャし、シームレスな字幕同期とインタラクティブなオーディオ体験を実現します。

laughter

動的なオーディオタグ付け

笑い声から足音まで、Scribeのテキスト変換モデルはすべての音声イベントにタグを付け、音声の完全な文脈でトランスクリプトを豊かにします。

99 Languages supported

グローバルな言語サポート

99の言語に対応し、言語の壁を打破—Scribeは、これまで手が届かなかった言語に対してAIによる文字起こしの機能を解放します。

Voice Library Image 1

音声のクリーンアップと編集ツール

バックグラウンドノイズ、リバーブ、不要な音を除去してクリーンな対話を実現。AIボイスチェンジャーでナレーターの声を瞬時に変更します。

DEVELOPERS(デベロッパー)

ElevenLabs Scribe (スクライブ) を統合する

世界で最も正確な音声テキスト変換モデルをアプリケーションにシームレスに統合します。話者識別、文字単位のタイムスタンプ、音声イベントのタグ付けなどの機能を紹介する、開発者に優しいサンプルを使って始めましょう。これにより、完璧な文字起こしが実現します。

Bar chart showing word error rates for different languages and speech recognition models.

FLEURSベンチマークパフォーマンス

Scribe V1の性能はFLEURSベンチマークで最先端です

A bar chart comparing word error rates for different voice recognition models across various countries.

Common Voiceベンチマークパフォーマンス

Scribe V1の性能はCommon Voiceベンチマークで最先端です

ベンチマーク

世界で最も正確なASRモデルで、99以上の言語に対応しています。

Center screen displays a presentation slide titled "The world's most accurate ASR model" by IIElevenLabs, with a gradient bar labeled "II Scribe" and version "V1".

他のASRモデルと比較したベンチマークによると、Scribeは主要な言語で98%以上の文字起こし精度を提供し、これまで十分に対応されてこなかった言語(セルビア語、広東語、マラヤーラム語など)ではエラーを大幅に減少させています。

無料で文字起こしを始める

AIによる99言語の音声からテキストへの変換

私たちのAIによる音声からテキストへの変換は99の言語に対応しています。言語を選択し、音声ファイルをアップロードするだけです。

Afrikaans スピーチ to テキスト
アフリカーンス語
Amharic スピーチ to テキスト
アムハラ語
Arabic スピーチ to テキスト
アラビア語
Armenian スピーチ to テキスト
アルメニア語
Assamese スピーチ to テキスト
アッサム語
Asturian スピーチ to テキスト
アストゥリアス語
Azerbaijani スピーチ to テキスト
アゼルバイジャン語
Belarusian スピーチ to テキスト
ベラルーシ語
Bengali スピーチ to テキスト
ベンガル語
Bosnian スピーチ to テキスト
ボスニア語
Bulgarian スピーチ to テキスト
ブルガリア語
Burmese スピーチ to テキスト
ビルマ語
Cantonese スピーチ to テキスト
広東語
Catalan スピーチ to テキスト
カタルーニャ語
Central Kurdish スピーチ to テキスト
中央クルド語
Chichewa スピーチ to テキスト
チェワ語
Chinese スピーチ to テキスト
中国語
Croatian スピーチ to テキスト
クロアチア語
Czech スピーチ to テキスト
チェコ語
Danish スピーチ to テキスト
デンマーク語
Dutch スピーチ to テキスト
オランダ語
English スピーチ to テキスト
英語
Estonian スピーチ to テキスト
エストニア語
Filipino スピーチ to テキスト
フィリピン語
Finnish スピーチ to テキスト
フィンランド語
French スピーチ to テキスト
フランス語
Fulah スピーチ to テキスト
フラ語
Galician スピーチ to テキスト
ガリシア語
Ganda スピーチ to テキスト
ガンダ語
Georgian スピーチ to テキスト
ジョージア語
German スピーチ to テキスト
ドイツ語
Greek スピーチ to テキスト
ギリシャ語
Gujarati スピーチ to テキスト
グジャラート語
Hausa スピーチ to テキスト
ハウサ語
Hebrew スピーチ to テキスト
ヘブライ語
Hindi スピーチ to テキスト
ヒンディー語
Hungarian スピーチ to テキスト
ハンガリー語
Icelandic スピーチ to テキスト
アイスランド語
Igbo スピーチ to テキスト
イボ語
Indonesian スピーチ to テキスト
インドネシア語
Irish スピーチ to テキスト
アイルランド語
Italian スピーチ to テキスト
イタリア語
Japanese スピーチ to テキスト
日本語
Javanese スピーチ to テキスト
ジャワ語
Kabuverdianu スピーチ to テキスト
カボベルデ語
Kannada スピーチ to テキスト
カンナダ語
Kazakh スピーチ to テキスト
カザフ語
Khmer スピーチ to テキスト
クメール語
Kirghiz スピーチ to テキスト
キルギス語
Korean スピーチ to テキスト
韓国語
Lao スピーチ to テキスト
ラオス語
Latvian スピーチ to テキスト
ラトビア語
Lingala スピーチ to テキスト
リンガラ語
Lithuanian スピーチ to テキスト
リトアニア語
Luo スピーチ to テキスト
ルオ語
Luxembourgish スピーチ to テキスト
ルクセンブルク語
Macedonian スピーチ to テキスト
マケドニア語
Malay スピーチ to テキスト
マレー語
Malayalam スピーチ to テキスト
マラヤーラム語
Maltese スピーチ to テキスト
マルタ語
Maori スピーチ to テキスト
マオリ語
Marathi スピーチ to テキスト
マラーティー語
Mongolian スピーチ to テキスト
モンゴル語
Nepali スピーチ to テキスト
ネパール語
Northern Sotho スピーチ to テキスト
北ソト語
Norwegian スピーチ to テキスト
ノルウェー語
Occitan スピーチ to テキスト
オック語
Oriya スピーチ to テキスト
オリヤー語
Pashto スピーチ to テキスト
パシュトゥー語
Pedi スピーチ to テキスト
ペディ語
Persian スピーチ to テキスト
ペルシャ語
Polish スピーチ to テキスト
ポーランド語
Portuguese スピーチ to テキスト
ポルトガル語
Punjabi スピーチ to テキスト
パンジャブ語
Romanian スピーチ to テキスト
ルーマニア語
Russian スピーチ to テキスト
ロシア語
Serbian スピーチ to テキスト
セルビア語
Shona スピーチ to テキスト
ショナ語
Sindhi スピーチ to テキスト
シンド語
Slovak スピーチ to テキスト
スロバキア語
Slovenian スピーチ to テキスト
スロベニア語
Somali スピーチ to テキスト
ソマリ語
Spanish スピーチ to テキスト
スペイン語
Swahili スピーチ to テキスト
スワヒリ語
Swedish スピーチ to テキスト
スウェーデン語
Tajik スピーチ to テキスト
タジク語
Tamil スピーチ to テキスト
タミル語
Telugu スピーチ to テキスト
テルグ語
Thai スピーチ to テキスト
タイ語
Turkish スピーチ to テキスト
トルコ語
Ukrainian スピーチ to テキスト
ウクライナ語
Umbundu スピーチ to テキスト
ウンブンドゥ語
Urdu スピーチ to テキスト
ウルドゥー語
Uzbek スピーチ to テキスト
ウズベク語
Vietnamese スピーチ to テキスト
ベトナム語
Welsh スピーチ to テキスト
ウェールズ語
Wolof スピーチ to テキスト
ウォロフ語
Xhosa スピーチ to テキスト
コサ語
Zulu スピーチ to テキスト
ズールー語

よくある質問

最近のスピーチ to テキストガイド & ハウツー

リソース
A close-up of a professional microphone in a recording studio with audio equipment in the background.

2025年のベスト音声認識アプリ

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン