Apresentando o Eleven v3 (alpha)

Experimente o v3

Eleven v3 Audio Tags: Dando vida ao diálogo com múltiplos personagens

Crie diálogos dinâmicos com múltiplos personagens usando Eleven v3 Audio Tags. Escreva vozes sobrepostas, interrupções e mudanças emocionais para conversas com IA naturais e realistas.

v3

Conversas movem a história. Com Eleven v3 Audio Tags, você pode agora escrever cenas com vozes sobrepostas, trocas rápidas e interações emocionais — tudo realizado por um único modelo.

Combinando tags como [interrompendo], [sobrepondo] ou [risos], você pode criar diálogos naturalistas que fluem como conversas humanas — com interrupções, mudanças de tom e reações espontâneas.

Isso não é apenas fala linha por linha. É uma performance com múltiplos personagens.

O que é diálogo com múltiplos personagens em fala de IA?

Background
DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.
Background
Marissa
starting to speak So I was thinking we could—
Chris
jumping in —test our new timing features?
Marissa
surprised Exactly! How did you—
Chris
overlapping —know what you were thinking? Lucky guess! Sorry, go ahead.
Marissa
cautiously Okay, so if we both try to talk at the same time—
Chris
—we'll probably crash the system!
Marissa
panicking Wait, are we crashing? I can't tell if this is a feature or a—
Chris
interrupting Bug! ...Did I just cut you off again?
Marissa
sighing Yes, but honestly? This is kind of fun.

Diálogo com múltiplos personagens é quando um modelo de voz desempenha múltiplos papéis distintos na mesma cena. Cada personagem fala em um estilo, tom ou ritmo diferente — às vezes até interrompendo ou falando ao mesmo tempo.

Com Eleven v3, você pode escrever isso diretamente: Marissa: [começando a falar] Então eu estava pensando que poderíamos— Chris: [interrompendo] —testar nossos novos recursos de tempo? Marissa: [surpresa] Exatamente! Como você— Chris: [sobrepondo] —sabia o que eu estava pensando? Chute de sorte! Marissa: [risos] Sério? Isso é meio divertido.

O resultado parece um diálogo real — não uma narração costurada.

De atuação de voz a interação

O que antes exigia múltiplos locutores, gravações e ajustes de tempo agora pode ser feito com um único script. As tags permitem que você direcione cada voz de forma independente dentro de uma cena.

Exemplo: Jessica: [sussurrando] Assim. Von Fusion: [sarcasticamente] Oh, bem, olhe só para você, Senhorita Chique. Jessica: [com sotaque francês] Isso é espetacular, não é?

As vozes não apenas se alternam — elas interagem, reagem e se sobrepõem.

Tags comuns para controle de múltiplos personagens

Aqui estão algumas tags essenciais para escrever diálogos naturais e reativos:

  • Cues de troca de turno: [interrompendo], [sobrepondo], [corta]
  • Mudanças emocionais: [animado], [irritado], [confuso], [casual]
  • Fluxo rítmico: [rápido], [hesita], [pausa], [prolongado]
  • Troca de identidade: [tom infantil], [voz grave], [voz de pirata], [tom robótico]

Essas podem ser combinadas para uma interação expressiva: [frustrado] Você nunca me escuta — [interrompendo] Porque você nunca diz o que quer dizer!

Sobreposição, ritmo e presença

Eleven v3 suporta entrega com consciência de tempo que permite que as vozes se interrompam ou falem umas sobre as outras naturalmente. Isso é essencial para humor, tensão ou realismo.

Neste trecho: Marissa: [em pânico] Espere, estamos caindo? Não consigo dizer se isso é um recurso ou um— Chris: [interrompendo] Bug! Marissa: [suspirando] Sim, mas sinceramente? Isso é meio divertido.

A cena parece viva porque a interação é fluida, não roteirizada turno a turno.

Dirigindo cenas, não apenas frases

Com Eleven v3, cenas de diálogo se tornam performances orquestradas. Você pode construir conversas inteiras — completas com personagens, tempo, emoção e entrega — usando um único script e um modelo.

Para contadores de histórias, roteiristas de jogos e designers interativos, isso desbloqueia a escrita de cenas complexas sem custos adicionais de produção. Você não está apenas escrevendo falas. Você está dirigindo a dinâmica do elenco.

Selecionando a voz certa

Clones de Voz Profissionais (PVCs) atualmente não estão totalmente otimizados para Eleven v3, resultando em uma qualidade de clone potencialmente inferior em comparação com modelos anteriores. Durante esta fase de pré-visualização de pesquisa, é melhor encontrar um Clone de Voz Instantâneo (IVC) ou uma voz projetada para seu projeto se você precisar usar os recursos do v3. A otimização de PVC para v3 está chegando em breve.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade