본문 바로가기

ElevenLabs SFX API로 사운드보드 만들기

ElevenLabs가 텍스트 음향 효과 AI 오디오 모델로 무한 사운드보드 SB1을 어떻게 만들었는지 알아보세요. 사용자가 원하는 소리를 즉시 생성할 수 있습니다.

SB1

원하는 소리를 무제한으로 만들어주는 사운드보드를 상상해보세요. ElevenLabs에서 바로 그런 제품을 만들었습니다 — 바로 SB1, 저희의 무한 사운드보드입니다. 겉보기에는 클릭이나 키보드 단축키로 작동하는 일반적인 패드 그리드처럼 보이지만, 실제로는 저희의 텍스트 음향 효과 AI 오디오 모델이 구동하고 있습니다.

사용 방법은 간단합니다. 떠오르는 소리를 설명만 하면 SB1이 바로 생성해줍니다. 기본 제공되는 소리도 있지만, 이마저도 원하는 대로 바꿀 수 있습니다.

아이디어에서 프로토타입까지

저희는 이렇게 시작했습니다: 만약 “잔잔한 숲속의 앰비언트 사운드”나 “극적인 관객의 놀람”처럼 설명만 입력하면 바로 사용할 수 있는 음향 효과가 나온다면 어떨까?

기존 사운드보드는 온라인에서 직접 찾아야 하는 고정된 MP3 라이브러리에 의존합니다. 적당한 소리를 찾아도 원하는 느낌과 딱 맞지 않는 경우가 많죠. 하지만 생성형 AI라면 이런 한계가 없습니다. 이제 더 이상 제한받지 않습니다.

SB1 Prototype

코드를 작성하기 전에 먼저 사랑스러운에서 SB1의 기본 프로토타입을 만들었습니다. 아직 API와 연결되진 않았지만, 디자인과 버튼 배치 등을 실험해볼 수 있었고, 이후 저희 개발팀이 최종 UI와 코드를 완성했습니다.

저희가 원한 건 동적으로 생성되는 콘텐츠 — 즉, 원하는 소리를 즉시 만들어내는 것이었습니다. 이 솔루션의 핵심이 바로 ElevenLabs SFX API입니다. API는 하나의 엔드포인트로 동작합니다:

POST https://api.elevenlabs.io/v1/sound-generation

프롬프트, 원하는 변형 개수(기본값은 4개), 그리고 Authorization 헤더에 API 키를 담아 JSON 페이로드를 전송하면 됩니다.

응답으로는 생성된 WAV 파일의 URL 배열이 반환됩니다. 여기서 각 클립을 스트리밍하거나 다운로드해서 패드에 할당할 수 있습니다. 루프 설정도 가능합니다. 더 자세한 소리를 원하면 프롬프트를 구체적으로 입력하세요.

Key API details

  • Headers:
    • Authorization: Bearer YOUR_API_KEY
    • Content-Type: application/json
  • Body parameters:
    • prompt (string): description of the sound
    • n (integer): number of variations (1–10)
    • format (string, optional): wav or mp3 (defaults to wav)

샘플 요청 예시는 다음과 같습니다:

{
  "prompt": "rain hitting the roof of a tent",
  "n": 4,
  "format": "wav"
}

그리고 4개의 URL 배열을 받게 됩니다. 이 API는 다양한 용도에 맞게 확장할 수 있도록 설계되었습니다 — 즉석 사운드보드 제작부터 게임 에셋 대량 생성까지 모두 가능합니다.

SB1 인터페이스 만들기

API가 준비되면, 프론트엔드 작업에 들어갑니다. SB1은 React와 Tailwind CSS로 만든 웹 앱입니다. 각 패드 컴포넌트에는 두 가지 모드가 있습니다:

  1. 프리셋: 저장된 사운드 URL 세트에서 불러오기
  2. 커스텀: SFX API로 사용자가 직접 생성

커스텀 모드에서 빈 패드를 클릭하면 프롬프트 입력창이 나타납니다. 설명을 입력하고 생성 버튼을 누르면 API가 4가지 옵션을 반환합니다. 바로 들어보고, 원하는 소리를 선택하면 패드가 즉시 업데이트됩니다. 키보드 단축키로도 패드를 실행할 수 있어, 리듬이나 효과음을 실시간으로 연주할 수 있습니다.

루프 컨트롤도 추가했습니다. 루프 버튼을 누르고 반복하고 싶은 소리를 선택하면, 해제할 때까지 계속 재생됩니다. SB1은 단순한 장난뿐 아니라 — 드럼머신, 앰비언트 사운드, 팟캐스트, 라이브 방송 효과음, 명상 등 다양한 용도로 활용할 수 있습니다.

실제 예시

앰비언트 사운드스케이프

  • 잔잔한 비: "나뭇잎에 떨어지는 가벼운 빗방울"
 / 
  • 폭우: "양철 지붕에 쏟아지는 굵은 빗소리"
 / 
  • 파도 소리: 잔잔하게 해변에 밀려오는 파도
 / 

“나뭇잎에 떨어지는 가벼운 빗방울”, “잔잔하게 해변에 밀려오는 파도”처럼 프롬프트를 입력해 각각의 소리를 생성했습니다. 그리고 해당 패드를 루프로 설정해 집중이나 명상에 어울리는 배경음을 만들었습니다.

드럼머신

  • 808 킥: "저음이 강한 808 킥"
 / 
  • 스네어: "타이트한 스네어 스냅"
 / 
  • 오픈 심벌: "여운이 남는 오픈 심벌"
 / 

드럼 라이브러리에서 샘플을 찾을 필요가 없습니다. “저음이 강한 808 킥”이나 “타이트한 스네어 스냅”처럼 설명만 입력하면 API가 4가지 버전을 제공합니다. A, S, D 키에 각각 매핑해 라이브 퍼포먼스 데모도 해봤습니다.

모델의 한계를 시험해보고 싶다면, 캐릭터의 목소리로 짧은 음성 클립도 만들 수 있습니다. 캐릭터를 지정하고 대사를 괄호 안에 넣으면 됩니다.

  • 신나는 DJ: 신나는 DJ가 "파티 시작해볼까요"라고 말하는 소리
 / 
  • 임무를 수행하는 오크: 거친 목소리의 오크가 "이 방은 정원 초과입니다"라고 말하는 소리
 / 
  • 사이렌 송: 몽환적인 여성 보컬이 "이제 집에 가서 자야 해, 파티는 끝났어"라고 노래하는 소리
 / 

커스텀 프리셋

직접 프리셋을 저장하고 이름을 붙일 수 있습니다 — 예를 들어 “라이브스트림 FX”에 놀람, 웃음, 박수 소리를 넣을 수 있습니다. 보드를 완성한 후 공유를 클릭하면 링크를 복사하거나 소셜 미디어에 바로 올릴 수 있습니다. 링크를 가진 누구나 SB1 설정을 불러와 직접 소리를 재생할 수 있습니다.

개발자를 위한 팁

  • 상태 비저장 방식: 각 API 호출은 독립적으로 동작합니다. 별도의 학습 파이프라인이나 대용량 샘플 라이브러리를 관리할 필요 없이, UI에서 사용하는 URL만 캐싱하면 됩니다.
  • 낮은 지연 시간: 일반적으로 2초 이내에 생성되어, 데모할 때도 거의 즉시 반응합니다.
  • 확장성: 수백 개의 소리를 동시에 생성해, 자체 CDN에 저장하고 트래픽이 많은 환경에서도 사용할 수 있습니다.
  • 유연한 포맷: 최고 음질이 필요하면 WAV, 파일 크기가 중요하면 MP3를 선택하세요.

직접 시작해보고 싶다면 문서에서 자세히 확인하세요. JavaScript, Python, cURL로 SFX API를 프로젝트에 연동하는 코드 예시도 준비되어 있습니다.

앞으로의 계획

SB1은 저희 음향 효과 모델의 가능성을 보여주는 데모 중 하나일 뿐입니다. OBS나 디지털 오디오 워크스테이션용 플러그인도 준비 중이라, 스트리밍이나 제작 소프트웨어를 벗어나지 않고도 새로운 소리를 만들 수 있습니다. 음악 관련 프롬프트(이국적인 타악기, 신스 텍스처 등) 성능도 계속 개선하고 있습니다.

멋진 결과물을 만들었다면 꼭 보여주세요. 소셜 미디어에서 태그하거나 프리셋 링크를 공유해 주세요. 스트리머, 팟캐스터, 게임 개발자, 혹은 단순히 소리로 놀기를 좋아하는 분이라면, SB1과 SFX API로 무한한 오디오 창작이 가능합니다.

지금 바로 무료로 체험해보세요 — MP3 라이브러리 없이도 가능합니다.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요