灵活定价,满足不同需求
价格不含任何税费、征收和关税。
根据使用需求计算费用
支付方式
产品

- Lovable
- Synthesia
- Stripe
- Perplexity
- Twilio
模型定价
文本转语音 API
用高质量模型将文本转为语音
每 1,000 字符价格
包含字符数
$0.05
20,000
$0.05
120,000
$0.05
440,000
$0.05
1,980,000
$0.05
5,980,000
$0.05
19,800,000
每 1,000 字符价格
包含字符数
$0.10
10,000
$0.10
60,000
$0.10
220,000
$0.10
990,000
$0.10
2,990,000
$0.10
9,900,000
语音转文本 API
实时或批量转写音频
每小时价格
实体检测(每小时)
关键词提示(每小时)
包含小时数
$0.22
$0.070
$0.050
4 小时 30 分钟
$0.22
$0.070
$0.050
27 小时
$0.22
$0.070
$0.050
100 小时
$0.22
$0.070
$0.050
450 小时
$0.22
$0.070
$0.050
1359 小时
$0.22
$0.070
$0.050
4500 小时
每小时价格
包含小时数
$0.39
2 小时 30 分钟
$0.39
15 小时
$0.39
56 小时
$0.39
254 小时
$0.39
767 小时
$0.39
2538 小时
Speech Engine API
为聊天机器人带来拟人化语音
每分钟包含通话数
每分钟额外通话数
突发计费(每分钟)
并发通话数
15 分钟
$0.080
$0.160
4
75 分钟
$0.080
$0.160
6
275 分钟
$0.080
$0.160
10
1,238 分钟
$0.080
$0.160
20
3,738 分钟
$0.080
$0.160
30
12,375 分钟
$0.080
$0.160
40
音乐
将文本提示生成音乐
每分钟价格
包含分钟数
每次 Finetune 费用
$0.150
3 分钟
$1.50
$0.150
40 分钟
$1.50
$0.150
147 分钟
$1.50
$0.150
660 分钟
$1.50
$0.150
1,993 分钟
$1.50
$0.150
6,600 分钟
$1.50
人声分离
去除音频背景噪音
每分钟价格
包含分钟数
$0.120
8.3 分钟
$0.120
50 分钟
$0.120
183 分钟
$0.120
825 分钟
$0.120
2,492 分钟
$0.120
8,250 分钟
变声器
变换声音特性
每分钟价格
包含分钟数
$0.120
8.3 分钟
$0.120
50 分钟
$0.120
183 分钟
$0.120
825 分钟
$0.120
2,492 分钟
$0.120
8,250 分钟
音效
根据文本描述生成音效
每分钟价格
包含生成次数
$0.120
8
$0.120
150
$0.120
605
$0.120
3,000
$0.120
9,000
$0.120
30,000
配音 v1
自动为音频和视频内容配音
每分钟价格(含水印)
包含分钟数(带水印)
每分钟价格(无水印)
包含分钟数(无水印)
$0.33
2.53 分钟
$0.50
$0.33
18 分钟
$0.50
12 分钟
$0.33
67 分钟
$0.50
44 分钟
$0.33
300 分钟
$0.50
198 分钟
$0.33
906 分钟
$0.50
598 分钟
$0.33
3,000 分钟
$0.50
1,980 分钟









