無料広東語スピーチ to テキスト転写

高度なAI転写ツールScribeを使用した無料の広東語スピーチ to テキスト。業界トップの精度で広東語の音声、オーディオ、スピーチを転写します。ScribeはGoogle GeminiやOpenAI Whisperを上回り、FLEURSベンチマークでわずか3.1%、Common Voiceで5.5%の単語誤り率を達成。映画、ポッドキャスト、ビジネス会議、医療用ディクテーションなどに正確な広東語転写を提供します。

フルオーディオAIプラットフォームを体験

すべての言葉を完璧にキャプチャ

Scribeはあらゆるニュアンスを聞き取り、広東語の言葉を比類なき精度でキャプチャします。99言語でのオーディオ転写を提供し、文字レベルのタイムスタンプ、話者の区別、オーディオイベントのタグ付けを行い、シームレスな統合のための構造化された結果を返します。

広東語転写ベンチマーク

モデルFLEURS
Scribe v1
5.9% WER
Deepgram Nova 2
19.3% WER
Gemini Flash 2
17.6% WER
Whisper Large v3
13.2% WER

アプリ向けの強力な広東語オーディオ to テキスト機能

Scribeを使って広東語のオーディオを完璧なテキストに変換。世界で最も進んだASR(自動音声認識)モデルとシンプルなスピーチ to テキストAPI統合

Progress bar with a gradient from black to purple, labeled "II Scribe V1," "Gemini 2.0 Flash," and "Whisper Large v3" on a black background.

業界トップの精度

これまでにない精度を実現—Scribeは業界で最も低い単語誤り率を提供し、完璧に正確な広東語転写を実現

Three colorful, glowing circles with radial patterns on a black background.

スマートな話者の区別

どんな会話でも、Scribeは直感的にすべての話者を区別し、ラベル付けして、明確で整理された転写を提供

Audio level meter with red peaks at 1:00, T4 and T5 markers, and time stamps at 0:58 and 1:02.

正確な単語レベルのタイムスタンプ

各単語が話される正確な瞬間をキャプチャ。Scribeの詳細なタイムスタンプは、シームレスな字幕同期とインタラクティブなオーディオ体験を可能にします

'It that funny? (laughter)

動的なオーディオタグ付け

笑い声から足音まで、Scribeの転写モデルはすべての音イベントをタグ付けし、オーディオの完全なコンテキストで広東語の転写を豊かにします

Multilingual text with the word "Multilingual" highlighted in blue and pink on a black background.

グローバル言語サポート

広東語を含む98の他の言語をサポートし、言語の壁を打破—Scribeはこれまで手の届かなかった言語のAI転写能力を解放

言語概要

広東語の言語情報

話者数: 8500万人 アクセント: 香港(標準)、広州、マカオ、マレーシア広東語 公用語: 香港とマカオ(中国語として) 使用地域: 中国南部(広東、広西)、香港、マカオ、華僑コミュニティ 6から9の声調(分析による)で知られる中国語。中世中国語からの特徴をより多く保持し、独特な書き言葉の伝統を持つ。

デベロッパー

ElevenLabs Scribeを統合

世界で最も正確な広東語スピーチ to テキストモデルをアプリケーションにシームレスに統合。話者の区別、文字レベルのタイムスタンプ、オーディオイベントのタグ付けなどの機能を示すデベロッパー向けの例で始めましょう。

99言語対応のAIスピーチ to テキスト転写

AIスピーチ to テキスト転写は99言語をサポート。言語を選択し、オーディオファイルをアップロードするだけです。

アフリカーンス語
アムハラ語
アラビア語
アルメニア語
アッサム語
アストゥリアス語
アゼルバイジャン語
ベラルーシ語
ベンガル語
ボスニア語
ブルガリア語
ビルマ語
広東語
カタルーニャ語
中央クルド語
チェワ語
中国語
クロアチア語
チェコ語
デンマーク語
オランダ語
英語
エストニア語
フィリピン語
フィンランド語
フランス語
フラ語
ガリシア語
ガンダ語
ジョージア語
ドイツ語
ギリシャ語
グジャラート語
ハウサ語
ヘブライ語
ヒンディー語
ハンガリー語
アイスランド語
イボ語
インドネシア語
アイルランド語
イタリア語
日本語
ジャワ語
カボベルデ語
カンナダ語
カザフ語
クメール語
キルギス語
韓国語
ラオス語
ラトビア語
リンガラ語
リトアニア語
ルオ語
ルクセンブルク語
マケドニア語
マレー語
マラヤーラム語
マルタ語
マオリ語
マラーティー語
モンゴル語
ネパール語
北ソト語
ノルウェー語
オック語
オリヤー語
パシュトゥー語
ペディ語
ペルシャ語
ポーランド語
ポルトガル語
パンジャブ語
ルーマニア語
ロシア語
セルビア語
ショナ語
シンド語
スロバキア語
スロベニア語
ソマリ語
スペイン語
スワヒリ語
スウェーデン語
タジク語
タミル語
テルグ語
タイ語
トルコ語
ウクライナ語
ウンブンドゥ語
ウルドゥー語
ウズベク語
ベトナム語
ウェールズ語
ウォロフ語
コサ語
ズールー語

よくある質問

優れた精度(≤ 5% 単語誤り率 - WER)
ブルガリア語、カタロニア語、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ガリシア語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、カンナダ語、マレー語、マラヤーラム語、マケドニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スロバキア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語、ベトナム語

高精度(>5% to ≤10% WER)
ベンガル語、ベラルーシ語、ボスニア語、広東語、エストニア語、フィリピン語、グジャラート語、ハンガリー語、カザフ語、ラトビア語、リトアニア語、標準中国語、マラーティー語、ネパール語、オディア語、ペルシャ語、スロベニア語、タミル語、テルグ語

良好(>10% to ≤25% WER)
アフリカーンス語、アラビア語、アルメニア語、アッサム語、アストゥリアス語、アゼルバイジャン語、ビルマ語、セブアノ語、クロアチア語、ジョージア語、ハウサ語、ヘブライ語、アイスランド語、ジャワ語、カーボベルデ語、韓国語、キルギス語、リンガラ語、マルタ語、モンゴル語、マオリ語、オック語、パンジャブ語、シンド語、スワヒリ語、タジク語、タイ語、ウルドゥー語、ウズベク語、ウェールズ語

中程度(>25% to ≤50% WER)
アムハラ語、チェワ語、フラ語、ガンダ語、イボ語、アイルランド語、クメール語、クルド語、ラオ語、ルクセンブルク語、ルオ語、北ソト語、パシュトー語、ショナ語、ソマリ語、ウンブンドゥ語、ウォロフ語、コーサ語、ズールー語

スピーチ to テキストは、広東語の音声を自動音声認識(ASR)を使用して書き起こす技術です。音声信号を処理し、スピーチパターンを識別し、高精度でテキストに転写します。 ElevenLabsのAIを活用したスピーチ to テキストソフトウェアは、人間のような精度でオーディオやビデオコンテンツを転写するよう設計されており、音声からテキストへの変換、オーディオ転写、リアルタイム音声認識に最適です。 スピーチ to テキスト技術は以下で使用されます: ✔ ポッドキャスト、会議、インタビューのオーディオからテキストへの転写。 ✔ ビデオコンテンツのキャプションと字幕。 ✔ ハンズフリー入力やアクセシビリティツールのための音声からテキストへのソフトウェア。 ElevenLabs ASRは、複数の言語とアクセントに対して迅速で信頼性が高く、非常に正確なスピーチ to テキスト変換を提供します。

ElevenLabsは、広東語の会話をテキスト形式に転写するビデオ転写を提供し、字幕やキャプション、検索可能な転写を簡単に作成できます。 ビデオをテキストに転写する手順: 1. ElevenLabs ASRにビデオファイルをアップロード 2. 音声認識技術がオーディオを処理 3. タイムスタンプ付きで自動的に転写が生成 4. テキストファイルをダウンロードまたは字幕をエクスポートして編集。 このAIを活用したビデオ転写モデルは、コンテンツクリエイター、企業、教育者がビデオスピーチを迅速に正確なテキストに転写し、アクセシビリティやコンテンツの再利用を支援します。

Scribeは現在、入力オーディオが事前に利用可能なユースケースでうまく機能します。低遅延のリアルタイムバージョンは近日中にリリース予定です。

転写されたオーディオ1時間あたり$0.40、大規模なエンタープライズプランではさらに低価格。
ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン