跳到内容

Scribe v2 全新升级

Scribe v2 Upgrade 1 1

现已支持内置实体脱敏、改进的印地-英语转写、新增非逐字模式,以及关键词提示扩展至最多 1,000 项。

这些升级让开发者在隐私保护、多语言准确性、转写质量和领域专属精度方面拥有更多控制权。

Scribe v2 新增实体脱敏功能

Scribe v2 现在可自动检测并脱敏转写中的敏感实体,包括姓名、信用卡号、社会安全号码及其他个人身份信息。

脱敏在转写过程中完成,敏感数据在存储或下游系统接收前即被移除。

  • 完全脱敏:将实体替换为 [REDACTED];
  • 分类脱敏:用实体类型替换,例如 [CREDIT_CARD];
  • 编号脱敏:用分类加编号标签替换,例如 [CREDIT_CARD_1]。

方便团队共享转录内容,同时支持医疗、金融、客服等多种场景下的数据处理流程。

精准的印地-英语混合转写

在印度,用户常将英语与印地语、泰卢固语、卡纳达语等混用。许多转写系统会将英语词汇音译为本地文字,导致转写内容与实际交流不符。

Scribe v2 会直接用英文转写英语词,无论周围语言为何。无需额外语言设置,无论输入英语、印地语或未指定语言代码,英语词始终保留拉丁字母。

该功能适用于所有印地语系语言,不仅限于印地-英语。无论是泰卢固语混英语还是卡纳达语混英语,英语部分都能准确转写。

非逐字模式,转写更简洁

新增非逐字模式,可自动去除“呃”“嗯”等语气词、重复短语和口吃内容。

无需手动编辑或后期处理,即可获得简洁易读的转写文本。

非逐字模式适用于会议记录、字幕等需要精炼书面内容的场景,而非原始音频的逐字还原。

关键词提示扩展至 1,000 项

关键词提示现支持每份转写最多 1,000 个词或短语,较此前上限提升 10 倍。

适合涉及大量专业词汇、产品目录或领域术语的团队,更灵活地引导模型实现精准转写。

关键词提示依然具备上下文感知能力,模型会根据音频内容判断是否适用关键词,而非盲目插入。1,000 项容量为原先的 10 倍。

注意:单次请求关键词超过 100 项时,最小计费单位为 20 秒。

现已上线

这些功能现已在 Scribe v2 API 和界面中上线。

查看文档:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart

在应用中试用:
https://elevenlabs.io/app/speech-to-text

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作