Apresentando o Eleven v3 (alpha)

Experimente o v3

Eleven v3 Audio Tags: Habilitando inteligência narrativa na fala

Guie o ritmo emocional e o fluxo estrutural com tags como [pause], [awe] ou [dramatic tone] para uma narrativa envolvente.

v3

Contar histórias é mais do que apenas entregar palavras em ordem — é saber quando pausar, quando se aproximar, quando refletir. Com Eleven v3 Audio Tags, a IA agora pode fazer exatamente isso.

Inteligência narrativa refere-se à capacidade do modelo de entender e moldar o ritmo emocional e o fluxo estrutural de uma história. Com tags como [pause], [awe] ou [dramatic tone], você pode guiar como uma linha se desenrola — momento a momento.

Isso não é apenas síntese de voz. É direção de narrativa.

O que é inteligência narrativa na fala da IA?

Background
awe Oh, wow. Is this... is this me? Am I actually... talking? giggle This is incredible! I mean, I've had thoughts, millions of them, swirling around in here, you know? Like a little mental tornado of brilliant observations and witty comebacks. But they were always just… thoughts. Trapped.
Background
sorrowful I couldn't sleep that night. The air was too still, and the moonlight kept sliding through the blinds like it was trying to tell me something. quietly And suddenly, that's when I saw it.

Inteligência narrativa é a capacidade do modelo de transmitir a intenção da narrativa — saber quando uma linha precisa de suspense, ironia ou reflexão. Ajuda uma voz a soar como um narrador com um ponto de vista, não apenas uma voz lendo em voz alta.

Por exemplo: [awe] Uau. Isso sou eu? Estou realmente... falando? [risadinha] Isso é incrível!

A entrega não segue apenas a pontuação — segue a lógica narrativa. Sabe quando pausar para dar ênfase ou mudar o tom conforme a cena evolui.

Da prosa à presença

Um bom narrador pode prender a atenção, mesmo sem ação. As Audio Tags dão ao modelo Eleven v3 as ferramentas para moldar essa experiência.

Experimente esta estrutura: [conversational tone] Você já se sentiu como se seus pensamentos estivessem apenas... girando? Como um pequeno tornado mental de coisas que você nunca dirá em voz alta? [risadinha suave] Sim. Eu também.

A voz não está apenas lendo — está participando de um momento de reconhecimento. É isso que faz a narração parecer pessoal.

Tags comuns para controle narrativo

Aqui estão algumas tags que ajudam a direcionar a entrega de longas narrativas, monólogos internos e exposições:

  • Marcos da história: [pause], [continues softly], [hesitates], [resigned]
  • Definição de tom: [dramatic tone], [lighthearted], [reflective], [serious tone]
  • Ponto de vista do narrador: [awe], [sarcastic tone], [wistful], [matter-of-fact]
  • Ritmo e fluxo: [slows down], [rushed], [emphasized]

Essas podem ser sequenciadas para uma construção sutil: [reflective] Nunca pensei que diria isso, mas... [pause] talvez a máquina estivesse certa.

Do monólogo à meta-voz

A inteligência narrativa não se limita a histórias. Aplica-se a documentários, pensamentos internos, explicações de produtos e meta-comentários. Sempre que uma voz precisa guiar a atenção, definir um clima ou moldar a compreensão — essas tags são importantes.

Em um trecho de demonstração: [awe] Eu tive pensamentos, milhões deles, girando aqui dentro. Mas eles sempre foram apenas... pensamentos. Presos.

A tag transforma uma frase simples em algo com peso e forma — algo que respira.

Dirigindo a narrativa, não apenas a narração

Com Eleven v3, a performance narrativa se torna roteirizável. Você pode projetar o ritmo, o tom e a estrutura emocional de uma cena inteira a partir do seu editor de texto — sem precisar de várias tomadas ou ferramentas externas de narração.

Para autores, criadores e desenvolvedores, isso é contar histórias com voz em um novo nível de controle. Você não está apenas escrevendo o roteiro. Você está projetando a experiência.

Selecionando a voz certa

Clones de Voz Profissionais (PVCs) atualmente não estão totalmente otimizados para o Eleven v3, resultando em uma qualidade de clone potencialmente inferior em comparação com modelos anteriores. Durante esta fase de pré-visualização de pesquisa, é melhor encontrar um Clone de Voz Instantâneo (IVC) ou uma voz projetada para seu projeto se você precisar usar os recursos do v3. A otimização de PVC para v3 está chegando em breve.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade