
ElevenLabs vs. Cartesia (June 2025)
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Apresentando o Eleven v3 (alpha)
Experimente o v3Crie diálogos dinâmicos com múltiplos personagens usando Eleven v3 Audio Tags. Escreva vozes sobrepostas, interrupções e mudanças emocionais para conversas com IA naturais e realistas.
Conversas movem a história. Com Eleven v3 Audio Tags, você pode agora escrever cenas com vozes sobrepostas, trocas rápidas e interações emocionais — tudo realizado por um único modelo.
Combinando tags como [interrompendo], [sobrepondo] ou [risos], você pode criar diálogos naturalistas que fluem como conversas humanas — com interrupções, mudanças de tom e reações espontâneas.
Isso não é apenas fala linha por linha. É uma performance com múltiplos personagens.
Diálogo com múltiplos personagens é quando um modelo de voz desempenha múltiplos papéis distintos na mesma cena. Cada personagem fala em um estilo, tom ou ritmo diferente — às vezes até interrompendo ou falando ao mesmo tempo.
Com Eleven v3, você pode escrever isso diretamente: Marissa: [começando a falar] Então eu estava pensando que poderíamos— Chris: [interrompendo] —testar nossos novos recursos de tempo? Marissa: [surpresa] Exatamente! Como você— Chris: [sobrepondo] —sabia o que eu estava pensando? Chute de sorte! Marissa: [risos] Sério? Isso é meio divertido.
O resultado parece um diálogo real — não uma narração costurada.
O que antes exigia múltiplos locutores, gravações e ajustes de tempo agora pode ser feito com um único script. As tags permitem que você direcione cada voz de forma independente dentro de uma cena.
Exemplo: Jessica: [sussurrando] Assim. Von Fusion: [sarcasticamente] Oh, bem, olhe só para você, Senhorita Chique. Jessica: [com sotaque francês] Isso é espetacular, não é?
As vozes não apenas se alternam — elas interagem, reagem e se sobrepõem.
Aqui estão algumas tags essenciais para escrever diálogos naturais e reativos:
Essas podem ser combinadas para uma interação expressiva: [frustrado] Você nunca me escuta — [interrompendo] Porque você nunca diz o que quer dizer!
Eleven v3 suporta entrega com consciência de tempo que permite que as vozes se interrompam ou falem umas sobre as outras naturalmente. Isso é essencial para humor, tensão ou realismo.
Neste trecho: Marissa: [em pânico] Espere, estamos caindo? Não consigo dizer se isso é um recurso ou um— Chris: [interrompendo] Bug! Marissa: [suspirando] Sim, mas sinceramente? Isso é meio divertido.
A cena parece viva porque a interação é fluida, não roteirizada turno a turno.
Com Eleven v3, cenas de diálogo se tornam performances orquestradas. Você pode construir conversas inteiras — completas com personagens, tempo, emoção e entrega — usando um único script e um modelo.
Para contadores de histórias, roteiristas de jogos e designers interativos, isso desbloqueia a escrita de cenas complexas sem custos adicionais de produção. Você não está apenas escrevendo falas. Você está dirigindo a dinâmica do elenco.
Clones de Voz Profissionais (PVCs) atualmente não estão totalmente otimizados para Eleven v3, resultando em uma qualidade de clone potencialmente inferior em comparação com modelos anteriores. Durante esta fase de pré-visualização de pesquisa, é melhor encontrar um Clone de Voz Instantâneo (IVC) ou uma voz projetada para seu projeto se você precisar usar os recursos do v3. A otimização de PVC para v3 está chegando em breve.
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Unlocking the Power of AI Voiceovers for eLearning