Apresentando o Eleven v3 (alpha)

Experimente o v3

Eleven v3 Audio Tags: Direcionando a performance de personagens na fala

Controle tom, emoção e ritmo para conversas naturais. Adicione performance de personagem ao seu Text to Speech.

v3

Audio Tags são uma ferramenta poderosa no Eleven v3 (alpha), o novo modelo de pesquisa preview de Text to Speech da ElevenLabs. Esses elementos permitem direção precisa não apenas sobre tom e ritmo — mas também sobre a performance vocal e de personagem.

Com tags como [voz de pirata], [sotaque francês] ou [sarcasticamente], a voz se torna uma ferramenta para contar histórias, não apenas narração. Junto com uma forte clonagem de voz de personagem, você pode capturar não apenas um som, mas uma performance completa.

Essas tags tornam possível mudar a identidade vocal no meio da linha, emular sotaques ou adotar arquétipos como vilões, narradores ou ajudantes — sem alterar o roteiro ou mudar para outra voz.

O que é performance de personagem na fala com IA?

Performance de personagem é a capacidade de entrar em um papel. Seja você um vilão extravagante, um capitão do mar rude ou um lojista local de Melbourne, as novas Audio Tags permitem guiar a entrega para combinar com o personagem que você deseja transmitir.

Com uma simples frase entre colchetes, você pode definir a cena: “[voz de pirata] Arr, o oceano aberto. Sentem isso, rapazes? Esse é o cheiro da liberdade... e um toque de motim.”

O modelo não apenas pronuncia palavras — ele as interpreta em personagem.

De sotaque a arquétipo

Background
Arr, the open ocean. Smell that, lads? That’s the scent of freedom… and just a hint of mutiny. (laughs wickedly) Now grab yer cutlasses, stow ya fear. Tonight, we dine like kings—or we sink like legends! (evil laugh)

Performance vocal não é apenas sobre volume ou emoção. É também sobre quem está falando. Com o Eleven v3, você pode acionar sotaques específicos, dialetos e estilos de fala instantaneamente. Por exemplo:

[sotaque americano] Você poderia mudar meu sotaque no modelo antigo? [desdenhoso] Não achava que sim. [sotaque australiano] Mas agora você pode — veja isso, amigo! [sotaque francês] Meu amor... é como uma rosa vermelha, vermelha.

Esse tipo de troca de identidade fluida é ideal para animação, jogos, ficção interativa ou qualquer momento em que a personalidade do falante importa.

Tags comuns para performance de personagem

Tags focadas em personagem permitem moldar identidade vocal e presença:

  • Sotaques e dialetos: [sotaque britânico], [sotaque australiano], [sotaque sulista dos EUA]
  • Arquétipos e papéis: [voz de pirata], [voz de cientista malvado], [tom infantil]
  • Estilos de fala: [dramático], [sarcasticamente], [objetivo], [choramingando]
  • Indicações de gênero: [narrador de fantasia], [voz de IA sci-fi], [filme noir clássico]

Sobrepor tags ajuda a dar vida aos personagens: “[dramático][sotaque francês] Você não entende... isso nunca foi sobre vingança. Foi sobre destino.”

De narrador a elenco completo

Em roteiros com vários personagens, Audio Tags facilitam a troca entre vozes. Adicione tensão, humor ou surpresa simplesmente mudando a performance do personagem no meio do diálogo — sem necessidade de edição extra.

Background
DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.

Veja este trecho de uma demonstração:"Jessica: [risos] Isso foi... lindo. Dr. Von Fusion: [dramático] Ser ou não ser — eis a questão! Jessica: [sotaque francês] Isso é espetacular, não é?"

O que antes exigia um elenco completo agora pode ser roteirizado em uma única faixa de voz — sem sacrificar alcance ou profundidade.

Dirigindo vozes, não apenas escrevendo falas

O Eleven v3 suporta mudanças vocais dinâmicas, mudanças contextuais e entrega consistente entre personagens. Isso significa que o modelo não apenas entende o que dizer — mas como cada personagem deve dizer.

Para criadores, isso desbloqueia uma nova dimensão de controle. Você não está apenas roteirizando diálogos. Você está dirigindo performances.

Selecionando a voz certa

Clones de Voz Profissionais (PVCs) atualmente não estão totalmente otimizados para o Eleven v3, resultando em uma qualidade de clone potencialmente inferior em comparação com modelos anteriores. Durante esta fase de pesquisa preview, é melhor encontrar um Clone de Voz Instantâneo (IVC) ou uma voz projetada para seu projeto se precisar usar os recursos do v3. A otimização de PVC para v3 está chegando em breve.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade