API料金

Multilingual v2 / v3
テキスト読み上げ
ビジネスプランの1,000文字あたりの開始価格
- 低遅延(約250-300ms)
- 高品質な音声生成
- 32言語対応
- 40,000文字制限

Scribe v2 リアルタイム
スピーチtoテキスト
ビジネスプランの1時間あたりの開始価格
- 低遅延(約150ms)
- 90以上の言語対応
- 正確な単語レベルのタイムスタンプ
- リアルタイム文字起こし
価格にはすべての税金、課税、関税が含まれていません。
モデル価格
テキスト読み上げ(TTS) API
高品質なモデルでテキストから音声を生成
1K文字あたりの価格
追加文字数(1Kあたり)
含まれる文字数
20,000
$0.08
60,000
$0.11
$0.15
200,000
$0.10
$0.12
1,000,000
$0.08
$0.09
4,000,000
$0.06
$0.06
22,000,000
1K文字あたりの価格
追加文字数(1Kあたり)
含まれる文字数
10,000
$0.17
30,000
$0.22
$0.30
100,000
$0.20
$0.24
500,000
$0.17
$0.18
2,000,000
$0.12
$0.12
11,000,000
Speech to Text API
音声をリアルタイムまたは一括で文字起こし
含まれる時間あたりのコスト
追加時間あたりのコスト
エンティティ検出(時間あたり)
キータームプロンプト(時間あたり)
含まれる時間
2時間30分
$0.40
$0.120
$0.080
12時間30分
$0.35
$0.48
$0.105
$0.070
62時間51分
$0.33
$0.40
$0.099
$0.066
300時間
$0.30
$0.33
$0.090
$0.060
1100時間
$0.22
$0.22
$0.066
$0.044
6000時間
含まれる時間あたりのコスト
追加時間あたりのコスト
含まれる時間
$0.48
10時間
$0.46
$0.63
48時間
$0.44
$0.53
225時間
$0.42
$0.46
786時間
$0.39
$0.39
3385時間
音楽
テキストプロンプトを音楽に変換
含まれる分あたりのコスト
追加分あたりのコスト
含まれる分数
11 分
$0.30
16 分
$0.35
$0.48
62 分
$0.33
$0.39
304 分
$0.30
$0.33
1,100 分
$0.28
$0.27
4,800 分
ボイスアイソレーター
オーディオからバックグラウンドノイズを除去
含まれる分あたりのコスト
追加分あたりのコスト
含まれる分数
10 分
$0.17
30 分
$0.22
$0.30
100 分
$0.20
$0.24
500 分
$0.17
$0.18
2,000 分
$0.12
$0.12
11,000 分
ボイスチェンジャー
声の特徴を変換
含まれる分あたりのコスト
追加分あたりのコスト
含まれる分数
10 分
$0.17
30 分
$0.22
$0.30
100 分
$0.20
$0.24
500 分
$0.17
$0.18
2,000 分
$0.12
$0.12
11,000 分
サウンドエフェクト
テキストの説明からサウンドエフェクトを生成
含まれる分あたりのコスト
含まれる生成回数
追加生成あたりのコスト
50
$0.10
150
$0.13
500
$0.18
$0.12
2,500
$0.14
$0.10
10,000
$0.11
$0.07
55,000
$0.07
ダビング v1
オーディオとビデオコンテンツを自動で吹き替え
ウォーターマーク付きの含まれる分あたりのコスト
ウォーターマーク付きの追加分あたりのコスト
ウォーターマーク付きの含まれる分数
ウォーターマークなしの含まれる分あたりのコスト
ウォーターマークなしの追加分あたりのコスト
ウォーターマークなしの含まれる分数
5 分
$0.33
15 分
$0.44
$0.60
50 分
$0.67
$0.90
33 分
$0.40
$0.48
250 分
$0.59
$0.72
167 分
$0.33
$0.36
1,000 分
$0.49
$0.54
667 分
$0.24
$0.24
5,500 分
$0.36
$0.36
3,667 分






