본문 바로가기

Eleven v3 오디오 태그: AI 음성의 정밀한 전달 제어

Eleven v3 오디오 태그로 타이밍, 리듬, 강조를 세밀하게 제어하세요. 밋밋한 전달을 생동감 넘치는 퍼포먼스로 바꿔줍니다.

v3

좋은 음성은 단순히 무슨 말을 하느냐가 아니라, 어떻게 말하느냐에 달려 있습니다. Eleven v3 오디오 태그를 사용하면 타이밍, 리듬, 강조를 세밀하게 조절할 수 있어, 한 문장의 속도와 흐름을 원하는 대로 연출할 수 있습니다.

[pause], [rushed], [stammers], [drawn out] 같은 태그를 활용해 각 문장이 전달되는 방식을 감정뿐 아니라 리듬까지 조절할 수 있습니다. 이런 제어가 밋밋한 전달을 퍼포먼스로 바꿔줍니다.

AI 음성에서 전달 제어란?

전달 제어란 말의 흐름을 조정하는 능력입니다. 얼마나 빠르게 진행되는지, 어디서 멈추는지, 언제 강조하는지 등을 직접 지정할 수 있습니다. 이런 요소들이 대사를 극적으로, 자연스럽게, 긴장감 있게, 혹은 유쾌하게 만들어줍니다.

그리고 Eleven v3에서는 전달 속도가 기본값에 고정되지 않습니다. 긴장감을 위해 느리게, 긴급함을 위해 빠르게, 유머를 위해 리듬을 추가하는 등, 스크립트에서 바로 조절할 수 있습니다.

Background

예시:  "아, 그러니까 드디어 내가 그 게임 42레벨을 깼어. 한 달 전에 그만둔다고 했던 그 게임 말이야... [laughs] 그리고 마지막 보스가... 그냥... [giggle] 토끼였어. [big laugh] 못 하겠더라. 너무 귀여웠어."

여기서 태그들이 템포와 타이밍을 만들어주고, 그 덕분에 대사가 제대로 전달됩니다.

타이밍, 속도, 존재감 제어하기

태그를 사용하면 사람들이 자연스럽게 말할 때 쓰는 미묘한 신호들을 직접 조절할 수 있습니다:

  • 멈춤 & 끊김: [잠시 멈춤], [숨을 쉼], [잠깐 쉬고 계속함]
  • 속도 신호: [급하게], [속도를 늦춤], [신중하게], [빠르게 이어감]
  • 머뭇거림 & 리듬: [더듬음], [길게 끎], [반복함], [소심하게]
  • 강조: [강조함], [다음 단어에 힘줌], [절제됨]

예시: "[drawn out] 그으으으럼... 네가... [suspicious tone] 마지막 조각 안 먹었다는 거야?"

이런 태그 덕분에 목소리의 느낌까지 완전히 제어할 수 있습니다.

톤과 의미를 위한 속도 조절

Background

같은 문장도 어떻게 전달하느냐에 따라 해석이 달라집니다.

비교:

  • 괜찮아요.
  • [flatly] 괜찮아요.
  • [quietly, after a pause] 저... 괜찮아요.
  • [angrily, fed up] 진짜 괜찮다니까!
  • [questioning]정말 [pause] 괜찮은 거 맞아요?
  • 괜찮아요. [pause] 진짜로!

같은 말도 전달 방식에 따라 의미가 달라집니다. 전달 제어를 통해 단어가 아니라 타이밍과 의도로 톤이 만들어집니다.

순간을 만드는 태그 조합

Background

전달 중심 태그에 감정이나 캐릭터 신호를 더해 장면 전체를 연출할 수 있습니다.

예시: [hesitant][nervous] 저... 이게 정말 될지 잘 모르겠어요. [gulps] 그래도 한번 해보죠.

또는: [whispering][pause] 들었어? [rushed] 숨자! 지금!

이렇게 리듬과 반응이 어우러져야 연기가 진짜처럼 느껴집니다.

텍스트만이 아니라 템포까지 연출

Eleven v3는 스크립트를 악보로 바꿔줍니다. 전달 제어는 그 악보를 지휘하는 역할이죠. 튜토리얼, 독백, 유머 등 어떤 스크립트든 오디오 태그로 프레임 단위까지 세밀하게 연출할 수 있습니다.

크리에이터에게는 한 문장의 흐름까지 완벽하게 통제할 수 있다는 의미입니다. 단순히 내용을 쓰는 게 아니라, 그 템포까지 직접 정하는 거죠.

목소리 선택하기

프로페셔널 음성 복제(PVC)는 현재 Eleven v3에 완전히 최적화되어 있지 않아, 이전 모델보다 복제 품질이 낮을 수 있습니다. v3 기능이 필요하다면 연구 프리뷰 단계에서는 인스턴트 음성 복제(IVC)나 디자인된 목소리를 사용하는 것이 좋습니다. PVC의 v3 최적화는 곧 제공될 예정입니다.

ElevenLabs 팀의 다른 글 보기

최고 품질의 AI 오디오로 창작하세요