본문 바로가기

ElevenLabs 대화형 AI로 DeepSeek R1과 대화하기

ElevenLabs 대화형 AI 플랫폼으로 DeepSeek R1에 목소리를 더했습니다

Flowchart diagram showing user interaction with speech-to-text and text-to-speech functions, involving an agent, LLM, and options for function calling and monitoring.

최근 DeepSeek에 대한 이야기가 많았지만, DeepSeek이 말을 할 수 있다면 어떤 목소리일지 궁금해한 사람은 없었습니다. 바로 여기서 ElevenLabs 대화형 AI를 활용해 DeepSeek R1과 대화할 수 있습니다.

ElevenLabs 대화형 AI는 맞춤형 실시간 대화형 음성 에이전트를 배포할 수 있는 플랫폼입니다. 이 플랫폼의 가장 큰 장점 중 하나는 유연성으로, 필요에 따라 다양한 LLM을 연결할 수 있다는 점입니다.

커스텀 LLM 옵션은 OpenAI 호환 API 제공업체와 함께 사용할 수 있으며, 모델이 툴 사용/함수 호출을 지원하면 됩니다. 문서에서 GroqCloud, Together AI, 그리고 Cloudflare에 대한 가이드를 확인할 수 있습니다. 이번 데모에서는 Cloudflare를 사용합니다.

이번에는 DeepSeek-R1-Distill-Qwen-32B 모델을 사용합니다. 이 모델은 Qwen2.5 기반으로 DeepSeek-R1에서 디스틸링된 모델입니다. 다양한 벤치마크에서 OpenAI-o1-mini를 능가하며, 밀집 모델 기준으로 새로운 최고 성능을 기록했습니다.

디스틸 버전을 사용하는 주된 이유는 순수 버전이 아직 함수 호출을 안정적으로 지원하지 않기 때문입니다. 실제로 R1 추론 모델은 아직 함수 호출을 전혀 지원하지 않습니다! 진행 상황이 궁금하다면 이 이슈를 팔로우해 최신 정보를 받아보세요.

ElevenLabs 대화형 AI 시작하기

커스텀 LLM 연결 과정은 매우 간단하며, 에이전트 생성부터 시작합니다. 이번 프로젝트에서는 Math Tutor 템플릿을 사용할 예정입니다. DeepSeek의 목소리가 궁금하다면, 직접 데모를 체험해보세요.

시작하려면 ElevenLabs 대화형 AI 앱 페이지로 이동해 “DeepSeeker”라는 새로운 AI 에이전트를 만드세요. DeepSeek의 추론 능력이 돋보일 수 있도록 Math Tutor 템플릿을 선택하고, “에이전트 생성”.

수학 템플릿에는 LLM이 작성한 그대로가 아니라 자연스러운 언어로 숫자와 수식을 읽어주도록 하는 시스템 프롬프트가 포함되어 있습니다. 예를 들어 LLM의 응답이 "ax^2=4"일 때, "알파 곱하기 x 제곱은 4". 

A system prompt instructing a mathematics tutor named Matilda to answer in full English sentences, readable aloud, with an example of a math expression.

추론 모델은 보통 자신의 “사고 과정”을 설명하지만, 시스템 프롬프트를 확장해 풀이 과정을 단계별로 설명하도록 하면 더 좋은 수학 강의를 들을 수 있습니다. 일반적으로 두거나, 구체적인 예시를 추가해 프롬프트를 확장할 수도 있습니다.

DeepSeek R1의 개성을 더 느끼고 싶다면, 빈 템플릿을 만들어 에이전트가 DeepSeek AI로 자신을 소개하고 다양한 주제의 질문에 답하도록 시스템 프롬프트를 설정할 수도 있습니다.

Cloudflare Workers AI로 DeepSeek R1 설정하기

다음으로, 에이전트에서 사용할 DeepSeek R1 버전의 엔드포인트가 필요합니다. 이번 예시에서는 Cloudflare를 사용하며, 여기서 DeepSeek-R1-Distill-Qwen-32B를 Workers AI 플랫폼에서 평가용으로 제공합니다. 물론 fireworks.ai, GroqCloud 등 다른 호스팅 옵션도 고려할 수 있습니다.together.ai

먼저 dash.cloudflare.com로 이동해 계정을 생성하거나 로그인하세요. 네비게이션에서 AI > Workers AI를 선택한 뒤, “Use REST API” 위젯을 클릭합니다.

Screenshot of a webpage titled "Welcome to Workers AI" with options to build AI applications, including "Build and deploy a Llama 3 Worker" and "Use REST API."

API 키를 받으려면 “Create a Workers AI API Token”을 클릭하고, 안전하게 보관하세요.

API 키를 받았다면, 바로 curl 요청으로 테스트해볼 수 있습니다. Cloudflare는 OpenAI 호환 API 엔드포인트를 제공해 매우 편리합니다. 이때 모델과 전체 엔드포인트(계정 ID 포함)를 꼭 기록해두세요.

예시: https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}c/ai/v1/

curl https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/ai/v1/chat/completions \
  -X POST \
  -H "Authorization: Bearer {API_TOKEN}" \
  -d '{
     "model": "@cf/deepseek-ai/deepseek-r1-distill-qwen-32b",
     "messages": [
       {"role": "system", "content": "You are a helpful assistant."},
       {"role": "user", "content": "How many Rs in the word Strawberry?"}
     ],
     "stream": false
   }'

ElevenLabs에서 커스텀 LLM 설정하기

다음 단계는 이 정보를 ElevenLabs의 에이전트에 추가하는 것입니다. 먼저, ElevenLabs 앱에서 DeepSeeker AI 에이전트로 이동해 맨 아래에 새로 만든 API 키를 시크릿으로 추가하세요. 예를 들어 CLOUDFLARE_AUTH_TOKEN과 같이 이름을 지정한 뒤 저장합니다.

Secure secrets management interface showing a Cloudflare auth token labeled "Unused" with options to add or delete secrets.

그 다음 LLM에서 커스텀 LLM 옵션을 선택하고, Cloudflare Workers AI OpenAI 호환 API 엔드포인트: https://api.cloudflare.com/client/v4/accounts/{ACCOUNT_ID}/ai/v1 를 입력하세요.

URL의 “{ACCOUNT_ID}” 부분을 본인의 Cloudflare 계정 ID로 꼭 바꿔주세요.

모델 ID 추가: @cf/deepseek-ai/deepseek-r1-distill-qwen-32b

마지막으로, 방금 생성한 시크릿을 선택하세요.

Screenshot of a web interface for configuring a custom Large Language Model (LLM) with fields for server URL, model ID, and API key.

테스트해보기

이제 모든 설정이 끝났으니, “AI 에이전트 테스트”를 클릭해 직접 테스트해보세요 아래 수학 문제로:

“두 기차가 동서 방향으로 각각 65mph, 85mph의 속도로 지나갑니다. 두 기차가 330마일 떨어지려면 얼마나 걸릴까요?”

참고: 결제 수단을 등록하지 않았다면 Cloudflare Workers AI API가 제한되어 응답 시간이 길어질 수 있습니다. 실제 운영 전에 결제 계정을 꼭 등록하세요. 다른 호스팅 플랫폼에서는 이런 문제가 없을 수 있습니다.

마무리

실시간 대화형 AI 에이전트를 ElevenLabs 대화형 AI 플랫폼으로 구축하면, OpenAI 호환 API 제공업체를 통해 커스텀 LLM을 연결해 새로운 모델이 출시될 때 빠르게 대응할 수 있습니다.

사용하려는 모델이 OpenAI 호환이고 함수 호출을 지원한다면, 실시간 음성 에이전트와 통합할 수 있습니다. 커스텀 데이터셋으로 파인튜닝한 모델도 포함됩니다. ElevenLabs 라이브러리의 다양한 목소기나, 직접 자신의 목소리를 복제.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요