Scribe v2 全新升级
- 发布时间
收听收听本文
现已支持内置实体脱敏、改进的印地-英语转写、新增非逐字模式,以及关键词提示扩展至最多 1,000 项。
这些升级让开发者在隐私保护、多语言准确性、转写质量和领域专属精度方面拥有更多控制权。
Scribe v2 新增实体脱敏功能
Scribe v2 现在可自动检测并脱敏转写中的敏感实体,包括姓名、信用卡号、社会安全号码及其他个人身份信息。
脱敏在转写过程中完成,敏感数据在存储或下游系统接收前即被移除。
- 完全脱敏:将实体替换为 [REDACTED];
- 分类脱敏:用实体类型替换,例如 [CREDIT_CARD];
- 编号脱敏:用分类加编号标签替换,例如 [CREDIT_CARD_1]。
方便团队共享转录内容,同时支持医疗、金融、客服等多种场景下的数据处理流程。
精准的印地-英语混合转写
在印度,用户常将英语与印地语、泰卢固语、卡纳达语等混用。许多转写系统会将英语词汇音译为本地文字,导致转写内容与实际交流不符。
Scribe v2 会直接用英文转写英语词,无论周围语言为何。无需额外语言设置,无论输入英语、印地语或未指定语言代码,英语词始终保留拉丁字母。
该功能适用于所有印地语系语言,不仅限于印地-英语。无论是泰卢固语混英语还是卡纳达语混英语,英语部分都能准确转写。
非逐字模式,转写更简洁
新增非逐字模式,可自动去除“呃”“嗯”等语气词、重复短语和口吃内容。
无需手动编辑或后期处理,即可获得简洁易读的转写文本。
非逐字模式适用于会议记录、字幕等需要精炼书面内容的场景,而非原始音频的逐字还原。
关键词提示扩展至 1,000 项
关键词提示现支持每份转写最多 1,000 个词或短语,较此前上限提升 10 倍。
适合涉及大量专业词汇、产品目录或领域术语的团队,更灵活地引导模型实现精准转写。
关键词提示依然具备上下文感知能力,模型会根据音频内容判断是否适用关键词,而非盲目插入。1,000 项容量为原先的 10 倍。
注意:单次请求关键词超过 100 项时,最小计费单位为 20 秒。
现已上线
这些功能现已在 Scribe v2 API 和界面中上线。
查看文档:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart
.webp&w=3840&q=80)
.webp&w=3840&q=80)


