Eleven v3 アルファのご紹介

v3を試す

無料ウルドゥー語音声からテキストへの転写

高度なAI転写ツールScribeを使用して、無料でウルドゥー語音声をテキストに変換。業界トップの精度でウルドゥー語の音声、オーディオ、スピーチを転写します。ScribeはGoogle GeminiやOpenAI Whisperを凌駕し、FLEURSベンチマークでわずか3.1%、Common Voiceで5.5%の単語誤り率を達成。映画、ポッドキャスト、ビジネス会議、医療用ディクテーションなどに正確なウルドゥー語転写を提供します。

フルオーディオAIプラットフォームを体験

すべての言葉を完璧に捉える

Scribeはあらゆるニュアンスを聞き取り、ウルドゥー語の各単語を比類なき精度で捉えます。99言語でのオーディオ転写を提供し、文字レベルのタイムスタンプ、話者の識別、オーディオイベントのタグ付けを行い、シームレスな統合のための構造化された結果を返します。

ウルドゥー語転写ベンチマーク

モデルFLEURS
Scribe v1
14.4% WER
Deepgram Nova 2
100.0% WER
Gemini Flash 2
12.5% WER
Whisper Large v3
46.6% WER

アプリ向けの強力なウルドゥー語オーディオからテキスト機能

Scribeを使ってウルドゥー語のオーディオを完璧なテキストに変換。世界で最も進んだASR(自動音声認識)モデルとシンプルな音声からテキストへのAPI統合

Progress bar with a gradient from black to purple, labeled "II Scribe V1," "Gemini 2.0 Flash," and "Whisper Large v3" on a black background.

業界トップの精度

これまでにない精度を実現—Scribeはウルドゥー語転写で業界最低の単語誤り率を提供

Three colorful, glowing circles with radial patterns on a black background.

スマートな話者識別

どんな会話でも、Scribeは直感的に各話者を識別しラベル付けし、明確で整理された転写を提供

Audio level meter with red peaks at 1:00, T4 and T5 markers, and time stamps at 0:58 and 1:02.

正確な単語レベルのタイムスタンプ

各単語が話される正確な瞬間を捉える。Scribeの詳細なタイムスタンプはシームレスな字幕同期とインタラクティブなオーディオ体験を可能にします

'It that funny? (laughter)

動的なオーディオタグ付け

笑い声から足音まで、Scribeの転写モデルはすべての音イベントをタグ付けし、オーディオの文脈を豊かにします

Multilingual text with the word "Multilingual" highlighted in blue and pink on a black background.

グローバルな言語サポート

ウルドゥー語を含む98の言語をサポートし、言語の壁を打破—Scribeはこれまで手の届かなかった言語にAI転写能力を解放します

言語概要

ウルドゥー語情報

話者数: 1億7千万 アクセント: ダキニ、レクタ、カリボリ(標準) 公用語: パキスタンとインド(公用語の一つとして) 使用地域: パキスタン、北インド、世界中の南アジア系ムスリムコミュニティ ペルシャ・アラビア文字で書かれるインド・アーリア語。詩的な伝統とフォーマルなレジスターで知られ、ペルシャ語とアラビア語の語彙が豊富。話し言葉ではヒンディー語と相互に理解可能。

デベロッパー

ElevenLabs Scribeを統合

世界で最も正確なウルドゥー語音声からテキストへのモデルをアプリケーションにシームレスに統合。話者の識別、文字レベルのタイムスタンプ、オーディオイベントのタグ付けなどの機能を紹介するデベロッパー向けの例で始めましょう。

99言語対応のAI音声からテキストへの転写

AI音声からテキストへの転写は99言語に対応。言語を選択し、オーディオファイルをアップロードするだけです。

アフリカーンス語
アムハラ語
アラビア語
アルメニア語
アッサム語
アストゥリアス語
アゼルバイジャン語
ベラルーシ語
ベンガル語
ボスニア語
ブルガリア語
ビルマ語
広東語
カタルーニャ語
中央クルド語
チェワ語
中国語
クロアチア語
チェコ語
デンマーク語
オランダ語
英語
エストニア語
フィリピン語
フィンランド語
フランス語
フラ語
ガリシア語
ガンダ語
ジョージア語
ドイツ語
ギリシャ語
グジャラート語
ハウサ語
ヘブライ語
ヒンディー語
ハンガリー語
アイスランド語
イボ語
インドネシア語
アイルランド語
イタリア語
日本語
ジャワ語
カボベルデ語
カンナダ語
カザフ語
クメール語
キルギス語
韓国語
ラオス語
ラトビア語
リンガラ語
リトアニア語
ルオ語
ルクセンブルク語
マケドニア語
マレー語
マラヤーラム語
マルタ語
マオリ語
マラーティー語
モンゴル語
ネパール語
北ソト語
ノルウェー語
オック語
オリヤー語
パシュトゥー語
ペディ語
ペルシャ語
ポーランド語
ポルトガル語
パンジャブ語
ルーマニア語
ロシア語
セルビア語
ショナ語
シンド語
スロバキア語
スロベニア語
ソマリ語
スペイン語
スワヒリ語
スウェーデン語
タジク語
タミル語
テルグ語
タイ語
トルコ語
ウクライナ語
ウンブンドゥ語
ウルドゥー語
ウズベク語
ベトナム語
ウェールズ語
ウォロフ語
コサ語
ズールー語

よくある質問

優れた精度(≤ 5% 単語誤り率 - WER)
ブルガリア語、カタロニア語、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ガリシア語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、カンナダ語、マレー語、マラヤーラム語、マケドニア語、ノルウェー語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スロバキア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語、ベトナム語

高精度(>5% to ≤10% WER)
ベンガル語、ベラルーシ語、ボスニア語、広東語、エストニア語、フィリピン語、グジャラート語、ハンガリー語、カザフ語、ラトビア語、リトアニア語、標準中国語、マラーティー語、ネパール語、オリヤ語、ペルシャ語、スロベニア語、タミル語、テルグ語

良好(>10% to ≤25% WER)
アフリカーンス語、アラビア語、アルメニア語、アッサム語、アストゥリアス語、アゼルバイジャン語、ビルマ語、セブアノ語、クロアチア語、ジョージア語、ハウサ語、ヘブライ語、アイスランド語、ジャワ語、カーボベルデ語、韓国語、キルギス語、リンガラ語、マルタ語、モンゴル語、マオリ語、オック語、パンジャブ語、シンド語、スワヒリ語、タジク語、タイ語、ウルドゥー語、ウズベク語、ウェールズ語

中程度(>25% to ≤50% WER)
アムハラ語、チェワ語、フラ語、ガンダ語、イボ語、アイルランド語、クメール語、クルド語、ラオ語、ルクセンブルク語、ルオ語、北ソト語、パシュトゥー語、ショナ語、ソマリ語、ウンブンドゥ語、ウォロフ語、コーサ語、ズールー語

音声からテキストへの技術は、ウルドゥー語の話し言葉を自動音声認識(ASR)を使用して書き起こす技術です。音声信号を処理し、音声パターンを識別し、高精度でテキストに転写します。 ElevenLabsのAIを活用した音声からテキストへのソフトウェアは、人間のような精度でオーディオやビデオコンテンツを転写するよう設計されており、音声からテキストへの変換、オーディオ転写、リアルタイム音声認識に最適です。 音声からテキストへの技術は以下で使用されます: ✔ ポッドキャスト、会議、インタビューのオーディオからテキストへの転写。 ✔ ビデオコンテンツのキャプションと字幕。 ✔ ハンズフリー入力やアクセシビリティツールのための音声からテキストへのソフトウェア。 ElevenLabs ASRは、複数の言語とアクセントに対して迅速で信頼性が高く、非常に正確な音声からテキストへの変換を提供します。

ElevenLabsは、ウルドゥー語の会話をテキスト形式に転写するビデオ転写を提供し、字幕やキャプション、検索可能な転写を簡単に作成できます。 ビデオをテキストに転写する手順: 1. ElevenLabs ASRにビデオファイルをアップロード 2. 音声認識技術がオーディオを処理 3. タイムスタンプ付きで自動的に転写が生成されます 4. テキストファイルをダウンロードするか、字幕を編集用にエクスポートします。 このAIを活用したビデオ転写モデルは、コンテンツクリエーター、企業、教育者がビデオ音声を迅速に正確なテキストに転写し、アクセシビリティやコンテンツの再利用を可能にします。

Scribeは現在、入力オーディオが事前に利用可能なユースケースでうまく機能します。低遅延のリアルタイムバージョンは近日中にリリース予定です。

転写されたオーディオ1時間あたり$0.40、大規模なエンタープライズプランではさらに低価格。
ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン