Apresentando o Eleven v3 (alpha)

Experimente o v3

Eleven v3 Audio Tags: Controle preciso de entrega para fala IA

Controle detalhado sobre tempo, ritmo e ênfase com Eleven v3 Audio Tags. Transforme uma entrega monótona em conteúdo dinâmico e performático.

v3

Uma boa fala não é apenas sobre o que é dito — é como é dito. Com Eleven v3 Audio Tags, você ganha controle detalhado sobre tempo, ritmo e ênfase, permitindo moldar o ritmo de uma linha com precisão.

Usando tags como [pause], [rushed], [stammers] ou [drawn out], você pode ajustar como cada frase é recebida — não apenas emocionalmente, mas ritmicamente. Esse controle transforma uma entrega monótona em performance.

O que é controle de entrega em fala IA?

Controle de entrega é a capacidade de direcionar o fluxo da fala — quão rápido ela se move, onde pausa, quando enfatiza. É o que faz uma linha parecer dramática, casual, tensa ou cômica.

Com Eleven v3, a entrega não está presa ao ritmo padrão. Você pode desacelerar para suspense, acelerar para urgência ou adicionar ritmo para humor — direto do roteiro.

Background
Okay, so like I finally beat level 42 of that game I said I’d quit like... a month ago. (laughs) And then for the final big scary mega boss... it's just (giggle) like some cute little bunny rabbit (hysterical laughing) I just couldn't do it (big laugh) It was sooooooo cute!

Exemplo: "Ok, então eu finalmente passei do nível 42 daquele jogo que eu disse que ia parar tipo... há um mês. [risos] E então o chefe final... era só... [risadinha] um coelhinho. [grande risada] Eu não consegui. Era fofo demais."

As tags aqui moldam o tempo e o ritmo — e é isso que faz a linha funcionar.

Controlando tempo, ritmo e presença

As tags dão acesso às sutis dicas que os humanos usam para ritmar a fala naturalmente:

  • Pausas e quebras: [pause], [breathes], [continues after a beat]
  • Dicas de velocidade: [rushed], [slows down], [deliberate], [rapid-fire]
  • Hesitação e ritmo: [stammers], [drawn out], [repeats], [timidly]
  • Ênfase: [emphasized], [stress on next word], [understated]

Exemplo: "[drawn out] Entãoooo... você está dizendo... [tom suspeito] que não comeu a última fatia?"

Essas tags dão controle total sobre como uma voz parece em movimento.

Ritmo para tom e significado

Background
Arabella
I’m fine.
Arabella
flatly I’m fine.
Arabella
quietly, after a pause I’m... fine.
Arabella
angrily, fed up  I'm FINE!
James
[questioning]Are you pause  sure you're fine?
Arabella
I’m fine. pause  really!

Mudar como uma linha é entregue muda como ela é interpretada.

Compare:

  • Estou bem.
  • [sem emoção] Estou bem.
  • [calmamente, após uma pausa] Eu estou... bem.
  • [irritado, cansado] Eu estou BEM!
  • [questionando] Você tem [pause] certeza de que está bem?
  • Estou bem. [pause] de verdade!

Mesmas palavras. Significado diferente. Com controle de entrega, o tom emerge não da escolha de palavras, mas do tempo e da intenção.

Combinações de tags que definem o momento

Background
Arabella
[hesitant][nervous] I... I’m not sure this is going to work. gulps But let’s try anyway.
Juniper
[whispering][pause] Did you hear that? rushed Hide! Now!

Você pode combinar tags focadas em entrega com dicas emocionais ou de personagem para moldar cenas inteiras.

Exemplo: [hesitante][nervoso] Eu... eu não tenho certeza se isso vai funcionar. [engole seco] Mas vamos tentar mesmo assim.

Ou: [sussurrando][pause] Você ouviu isso? [apressado] Esconda-se! Agora!

É essa mistura de ritmo e reação que faz as performances parecerem críveis.

Dirigindo o tempo, não apenas o texto

Eleven v3 transforma o roteiro em uma partitura — e o controle de entrega é como você a conduz. Seja escrevendo tutoriais, monólogos ou piadas, Audio Tags permitem gerenciar a entrega com precisão quadro a quadro.

Para os criadores, isso significa comando total sobre como uma linha se desenrola. Você não está apenas escrevendo o que acontece. Você está definindo seu ritmo.

Selecionando a voz certa

Clones de Voz Profissionais (PVCs) atualmente não estão totalmente otimizados para Eleven v3, resultando em uma qualidade de clone potencialmente inferior em comparação com modelos anteriores. Durante esta fase de pré-visualização de pesquisa, é melhor encontrar um Clone de Voz Instantâneo (IVC) ou uma voz projetada para seu projeto se precisar usar os recursos do v3. A otimização de PVC para v3 está chegando em breve.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade