본문 바로가기

대화형 AI 소개

맞춤형, 인터랙티브 보이스 에이전트를 구축할 수 있는 올인원 플랫폼

Diagram of a speech-to-text and text-to-speech system with user, agent, LLM, monitoring, and function calling components.

오늘 ElevenLabs가 자신 있게 선보이는 대화형 AI - 맞춤형, 인터랙티브 보이스 에이전트를 구축할 수 있는 올인원 플랫폼입니다. 대화형 AI로 아웃바운드 영업 다이얼러, 스케줄링 에이전트, 게임 캐릭터, 튜터, 고객 지원 에이전트 등 다양한 에이전트를 만들 수 있습니다.

서버 호출을 최소화해 지연을 줄인 플랫폼입니다. 대화형 AI는 실시간 모델을 통해 발화가 끝나는 시점을 예측해 자연스럽게 대화의 순서를 주고받고, 중간에 끼어드는 상황도 매끄럽게 처리합니다. 기술적 설정도 간소화해 에이전트 커스터마이징에 집중할 수 있습니다.

대화형 AI는 실제 같은 텍스트 음성 변환, 음성 인식(Speech to Text), 원하는 LLM, 그리고 ElevenLabs만의 대화 순서 및 인터럽트 로직을 연결해 자연스러운 대화를 구현합니다. 여러분은 다음에 집중할 수 있습니다:

  • 지식 베이스 구축
  • 시스템 프롬프트 작성
  • 함수 호출로 앱 연결
  • 보이스 라이브러리에서 원하는 목소리 선택 또는 직접 음성 복제
  • 대화형 AI로 고객에게 놀라운 경험 제공 방법 찾기

대화형 AI에는 더 인터랙티브한 에이전트 구축을 위한 고급 기능이 포함되어 있습니다:

  • 통화 처리를 위한 Twilio 네이티브 연동
  • 유연성을 높여주는 서버/클라이언트 측 툴 호출
  • 개인화된 대화를 위한 동적 프롬프트

첫 번째 에이전트를 설정하는 방법을 소개합니다. 완전한 제어를 원한다면, 직접 LLM이나 서버를 이 가이드로 연결할 수 있습니다.Python, Javascript, React, Swift SDK도 제공하며, WebSocket API로 직접 연동할 수도 있습니다.

SDK로 만든 예시 프로젝트도 여기에서 확인할 수 있습니다.

대화형 AI가 어떻게 만들어졌는지 궁금하다면, 리드 엔지니어 Jozef의 이야기를 여기에서 들어보세요.

대화형 AI 에이전트로 스타트업을 시작할 계획이신가요? 무료 스타트업 지원 프로그램 대상이 될 수 있습니다. 자세히 알아보기 여기에서 확인하세요.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요