跳到内容

用 ElevenLabs 对话式 AI 与 DeepSeek R1 对话

我们通过 ElevenLabs 对话式 AI 平台为 DeepSeek R1 赋予了声音

Flowchart diagram showing user interaction with speech-to-text and text-to-speech functions, involving an agent, LLM, and options for function calling and monitoring.

最近大家都在讨论 DeepSeek,但很少有人想过:如果 DeepSeek 能说话,会是什么声音?这正是我们可以用 ElevenLabs 的对话式 AI 来实现与 DeepSeek R1 对话。

ElevenLabs 对话式 AI 是一个可部署定制化实时对话语音智能体的平台。平台的一大优势是灵活性,可以根据需求接入不同的 LLM。

自定义 LLM 选项支持任何兼容 OpenAI 的 API 服务商,只要模型支持工具调用/函数调用。文档中有 GroqCloud, 、Together AICloudflare 的接入指南。本次演示我们用的是 Cloudflare。

我们用的是 DeepSeek-R1-Distill-Qwen-32B 模型,这是基于 Qwen2.5 从 DeepSeek-R1 蒸馏而来的版本。它在多项基准测试中超越了 OpenAI-o1-mini,刷新了密集模型的新纪录。

我们选择蒸馏版的主要原因是原版目前 还不能稳定支持 函数调用。实际上 R1 推理模型目前还完全不支持函数调用!你可以关注 这个问题,了解最新进展。

用 ElevenLabs 对话式 AI 快速上手

接入自定义 LLM 的流程很简单,首先需要创建一个智能体。本项目我们用 Math Tutor 模板。如果你只想体验 DeepSeek 的声音,可以直接 试用演示.

要开始体验,请前往 ElevenLabs 对话式 AI 应用页面,新建一个名为“DeepSeeker”的 AI 智能体。选择 Math Tutor 模板,这样可以发挥 DeepSeek 的推理能力,然后点击“创建智能体”.

数学模板内置了系统提示词,确保数字和公式能用自然语言读出,而不是直接照 LLM 输出。例如我们会让它说“Alpha 乘以 x 的平方等于 4”,如果 LLM 的回复是“ax^2=4". 

A system prompt instructing a mathematics tutor named Matilda to answer in full English sentences, readable aloud, with an example of a math expression.

推理模型通常会解释它的“思考链路”,但我们也可以扩展系统提示词,确保它能像数学讲解一样,逐步给出解题思路。你可以保持通用,也可以加入具体示例。

如果你更想了解 DeepSeek R1 的个性,也可以新建一个空白模板,让智能体自我介绍为 DeepSeek AI,并设置系统提示词,让它回答各类不同主题的问题。

用 Cloudflare Workers AI 配置 DeepSeek R1

接下来需要获取一个 DeepSeek R1 版本的 endpoint,用于智能体。本例我们用 Cloudflare,它在 Workers AI 平台 上提供 DeepSeek-R1-Distill-Qwen-32B 供评估使用,你也可以考虑 fireworks.ai, GroqCloud 等其他托管方案。together.ai

首先,前往 dash.cloudflare.com,注册或登录账户。在导航栏选择 AI > Workers AI,然后点击“Use REST API”组件。

Screenshot of a webpage titled "Welcome to Workers AI" with options to build AI applications, including "Build and deploy a Llama 3 Worker" and "Use REST API."

要获取 API 密钥,点击“Create a Workers AI API Token”,并妥善保存。

拿到 API 密钥后,可以用 curl 直接测试。Cloudflare 提供兼容 OpenAI 的 API endpoint,使用非常方便。此时请记下模型和完整 endpoint,包括账户 ID。

例如:https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}c/ai/v1/

curl https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/ai/v1/chat/completions \
  -X POST \
  -H "Authorization: Bearer {API_TOKEN}" \
  -d '{
     "model": "@cf/deepseek-ai/deepseek-r1-distill-qwen-32b",
     "messages": [
       {"role": "system", "content": "You are a helpful assistant."},
       {"role": "user", "content": "How many Rs in the word Strawberry?"}
     ],
     "stream": false
   }'

在 ElevenLabs 配置自定义 LLM

下一步,把这些信息添加到 ElevenLabs 的智能体中。首先进入 ElevenLabs 应用,在页面底部添加刚创建的 API 密钥作为密钥变量,比如命名为 CLOUDFLARE_AUTH_TOKEN,然后保存。

Secure secrets management interface showing a Cloudflare auth token labeled "Unused" with options to add or delete secrets.

接着,在 LLM 选项中选择自定义 LLM,并填写 Cloudflare Workers AI 兼容 OpenAI 的 API endpoint:https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/ai/v1

请将 URL 中的“{ACCOUNT_ID}”替换为 Cloudflare 显示的账户 ID。

添加模型 ID:@cf/deepseek-ai/deepseek-r1-distill-qwen-32b

最后选择刚刚创建的密钥。

Screenshot of a web interface for configuring a custom Large Language Model (LLM) with fields for server URL, model ID, and API key.

测试效果

现在一切就绪,点击“测试 AI 智能体”,试试看,用下面这道数学题:

“两列火车分别以 65 英里/小时和 85 英里/小时的速度东西相向行驶,多久后两车相距 330 英里?”

注意:如果未设置付款方式,Cloudflare Workers AI API 会限速,响应时间可能较长。建议在正式使用前先完成账单设置。其他托管平台可能没有这个问题。

总结

用 ElevenLabs 对话式 AI 平台实时构建 AI 智能体,可以灵活接入任何兼容 OpenAI 的 API 服务商的自定义 LLM,快速适配新模型。

只要模型兼容 OpenAI 且支持函数调用,就能集成到实时 语音智能体。也可以用你自己微调的数据集训练的模型。ElevenLabs 声音库里的任意音色都可用——或者用你克隆的声音.

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作