
ElevenLabs vs. Cartesia (June 2025)
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Apresentando o Eleven v3 (alpha)
Experimente o v3Controle tom, emoção e ritmo para conversas naturais. Adicione performance de personagem ao seu Text to Speech.
Audio Tags são uma ferramenta poderosa no Eleven v3 (alpha), o novo modelo de pesquisa preview de Text to Speech da ElevenLabs. Esses elementos permitem direção precisa não apenas sobre tom e ritmo — mas também sobre a performance vocal e de personagem.
Com tags como [voz de pirata], [sotaque francês] ou [sarcasticamente], a voz se torna uma ferramenta para contar histórias, não apenas narração. Junto com uma forte clonagem de voz de personagem, você pode capturar não apenas um som, mas uma performance completa.
Essas tags tornam possível mudar a identidade vocal no meio da linha, emular sotaques ou adotar arquétipos como vilões, narradores ou ajudantes — sem alterar o roteiro ou mudar para outra voz.
Performance de personagem é a capacidade de entrar em um papel. Seja você um vilão extravagante, um capitão do mar rude ou um lojista local de Melbourne, as novas Audio Tags permitem guiar a entrega para combinar com o personagem que você deseja transmitir.
Com uma simples frase entre colchetes, você pode definir a cena: “[voz de pirata] Arr, o oceano aberto. Sentem isso, rapazes? Esse é o cheiro da liberdade... e um toque de motim.”
O modelo não apenas pronuncia palavras — ele as interpreta em personagem.
Performance vocal não é apenas sobre volume ou emoção. É também sobre quem está falando. Com o Eleven v3, você pode acionar sotaques específicos, dialetos e estilos de fala instantaneamente. Por exemplo:
[sotaque americano] Você poderia mudar meu sotaque no modelo antigo? [desdenhoso] Não achava que sim. [sotaque australiano] Mas agora você pode — veja isso, amigo! [sotaque francês] Meu amor... é como uma rosa vermelha, vermelha.
Esse tipo de troca de identidade fluida é ideal para animação, jogos, ficção interativa ou qualquer momento em que a personalidade do falante importa.
Tags focadas em personagem permitem moldar identidade vocal e presença:
Sobrepor tags ajuda a dar vida aos personagens: “[dramático][sotaque francês] Você não entende... isso nunca foi sobre vingança. Foi sobre destino.”
Em roteiros com vários personagens, Audio Tags facilitam a troca entre vozes. Adicione tensão, humor ou surpresa simplesmente mudando a performance do personagem no meio do diálogo — sem necessidade de edição extra.
Veja este trecho de uma demonstração:"Jessica: [risos] Isso foi... lindo. Dr. Von Fusion: [dramático] Ser ou não ser — eis a questão! Jessica: [sotaque francês] Isso é espetacular, não é?"
O que antes exigia um elenco completo agora pode ser roteirizado em uma única faixa de voz — sem sacrificar alcance ou profundidade.
O Eleven v3 suporta mudanças vocais dinâmicas, mudanças contextuais e entrega consistente entre personagens. Isso significa que o modelo não apenas entende o que dizer — mas como cada personagem deve dizer.
Para criadores, isso desbloqueia uma nova dimensão de controle. Você não está apenas roteirizando diálogos. Você está dirigindo performances.
Clones de Voz Profissionais (PVCs) atualmente não estão totalmente otimizados para o Eleven v3, resultando em uma qualidade de clone potencialmente inferior em comparação com modelos anteriores. Durante esta fase de pesquisa preview, é melhor encontrar um Clone de Voz Instantâneo (IVC) ou uma voz projetada para seu projeto se precisar usar os recursos do v3. A otimização de PVC para v3 está chegando em breve.
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Unlocking the Power of AI Voiceovers for eLearning