Scribe v2 全新升级

收听收听本文

0:00

0:000:00

现已支持内置实体脱敏、改进的印地-英语转写、新增非逐字模式，以及关键词提示扩展至最多 1,000 项。

这些升级让开发者在隐私保护、多语言准确性、转写质量和领域专属精度方面拥有更多控制权。

Scribe v2 新增实体脱敏功能

Scribe v2 现在可自动检测并脱敏转写中的敏感实体，包括姓名、信用卡号、社会安全号码及其他个人身份信息。

脱敏在转写过程中完成，敏感数据在存储或下游系统接收前即被移除。

方便团队共享转录内容，同时支持医疗、金融、客服等多种场景下的数据处理流程。

在印度，用户常将英语与印地语、泰卢固语、卡纳达语等混用。许多转写系统会将英语词汇音译为本地文字，导致转写内容与实际交流不符。

Scribe v2 会直接用英文转写英语词，无论周围语言为何。无需额外语言设置，无论输入英语、印地语或未指定语言代码，英语词始终保留拉丁字母。

该功能适用于所有印地语系语言，不仅限于印地-英语。无论是泰卢固语混英语还是卡纳达语混英语，英语部分都能准确转写。

新增非逐字模式，可自动去除“呃”“嗯”等语气词、重复短语和口吃内容。

无需手动编辑或后期处理，即可获得简洁易读的转写文本。

非逐字模式适用于会议记录、字幕等需要精炼书面内容的场景，而非原始音频的逐字还原。

关键词提示现支持每份转写最多 1,000 个词或短语，较此前上限提升 10 倍。

适合涉及大量专业词汇、产品目录或领域术语的团队，更灵活地引导模型实现精准转写。

关键词提示依然具备上下文感知能力，模型会根据音频内容判断是否适用关键词，而非盲目插入。1,000 项容量为原先的 10 倍。

注意：单次请求关键词超过 100 项时，最小计费单位为 20 秒。

这些功能现已在 Scribe v2 API 和界面中上线。