Como funciona o desconto de 80% do Eleven v3?

O Eleven v3 está com 80% de desconto até o final de junho de 2025 para usuários self-service que utilizam pela interface.

Como foram gerados os exemplos do vídeo e do site?

Eles foram gerados apenas com o modelo Eleven v3.

Como funciona a geração de diálogos?

O Text to Dialogue une várias vozes para criar uma interação fluida entre elas. Combinando prosódia, variação emocional e usando as tags de áudio, o Text to Dialogue representa um avanço na criação de conversas envolventes.

Está disponível via API?

A API pública para o Eleven v3 (alpha) estará disponível em breve. Para acesso antecipado, fale com vendas .

Quais tags de áudio são suportadas?

O Eleven v3 suporta uma grande variedade de tags de áudio, que podem variar conforme a voz e o contexto. Leia o para mais informações.

Quais idiomas são suportados?

Africâner (afr), Árabe (ara), Armênio (hye), Assamesa (asm), Azerbaijano (aze), Bielorrusso (bel), Bengali (ben), Bósnio (bos), Búlgaro (bul), Catalão (cat), Cebuano (ceb), Chichewa (nya), Croata (hrv), Tcheco (ces), Dinamarquês (dan), Holandês (nld), Inglês (eng), Estoniano (est), Filipino (fil), Finlandês (fin), Francês (fra), Galego (glg), Georgiano (kat), Alemão (deu), Grego (ell), Guzerate (guj), Hauçá (hau), Hebraico (heb), Hindi (hin), Húngaro (hun), Islandês (isl), Indonésio (ind), Irlandês (gle), Italiano (ita), Japonês (jpn), Javanês (jav), Canarês (kan), Cazaque (kaz), Quirguiz (kir), Coreano (kor), Letão (lav), Lingala (lin), Lituano (lit), Luxemburguês (ltz), Macedônio (mkd), Malaio (msa), Malaiala (mal), Mandarim (cmn), Marata (mar), Nepalês (nep), Norueguês (nor), Pashto (pus), Persa (fas), Polonês (pol), Português (por), Punjabi (pan), Romeno (ron), Russo (rus), Sérvio (srp), Sindi (snd), Eslovaco (slk), Esloveno (slv), Somali (som), Espanhol (spa), Suaíli (swa), Sueco (swe), Tâmil (tam), Telugu (tel), Tailandês (tha), Turco (tur), Ucraniano (ukr), Urdu (urd), Vietnamita (vie), Galês (cym)

Apresentando o Eleven v3 (alpha)

Escrito por: Piotr Dabkowski; Mati Staniszewski
Publicado: 3 de jun. de 2025

OuvirOuça este artigo

0:00

0:000:00

Falar com vendas

Saiba mais

Temos o prazer de apresentar o Eleven v3 (alpha) — o modelo de Text to Speech mais expressivo.

O Eleven v3 não está mais em versão alpha e já está disponível para todos.

Mais de 70 idiomas
Diálogo com vários falantes
Tags de áudio como [excited], [whispers] e [sighs]

Mais de 70 idiomas exige mais engenharia de prompts do que os modelos anteriores — mas os resultados são impressionantes.

Se você trabalha com vídeos, audiolivros ou ferramentas de mídia, isso abre um novo nível de expressividade. Para usos em tempo real e conversacionais, recomendamos continuar com o v2.5 Turbo ou Flash por enquanto. Uma versão em tempo real do v3 está em desenvolvimento.

Se você trabalha com vídeos, audiolivros ou ferramentas de mídia — isso traz um novo nível de expressividade. Para usos em tempo real e conversas, recomendamos continuar usando o v2.5 Turbo ou Flash por enquanto. Uma versão em tempo real do v3 está em desenvolvimento.

Por que criamos o v3

Por que criamos o v3expressividade. Emoções mais marcantes, interrupções naturais e conversas críveis eram difíceis de alcançar.

Desde o lançamento do Multilingual v2, vimos a voz IA ser adotada em filmes profissionais, desenvolvimento de jogos, educação e acessibilidade. Mas a limitação não era a qualidade do som — era a

O Eleven v3 resolve essa lacuna. Ele foi criado do zero para entregar vozes que suspiram, sussurram, riem e reagem — gerando falas que parecem realmente vivas e responsivas.

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Como usar tags de áudio

Como usar tags de áudioguia de prompting para o v3 na documentação.

As tags de áudio ficam no próprio texto do seu roteiro e são escritas entre colchetes em minúsculas. Você pode saber mais sobre as tags de áudio no nosso

Os Clones de Voz Profissionais (PVCs) ainda não estão totalmente otimizados para o Eleven v3, o que pode resultar em clones de qualidade inferior em relação aos modelos anteriores. Durante esta fase de prévia de pesquisa, o ideal é usar um

“[happily][shouts] We did it! [laughs].”

Criando diálogos com vários falantes

Criando diálogos com vários falantesendpoint Text to Dialogue na API. Basta enviar um array estruturado de objetos JSON — cada um representando a fala de um personagem — e o modelo gera um arquivo de áudio coeso, com sobreposição de vozes:

[
  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
]

O endpoint gerencia automaticamente as transições entre falantes, mudanças de emoção e interrupções.

O endpoint gerencia automaticamente as trocas de falante, mudanças de emoção e interrupções.aqui.

v3 is our most expressive model

Preços e disponibilidade

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

Para ativar o v3:

Use o Model Picker e selecione Eleven v3 (alpha)

O acesso via API e suporte no Studio estarão disponíveis em breve. Para acesso antecipado, por favor fale com vendas.

O acesso via API e suporte no Estúdio estarão disponíveis em breve. Para acesso antecipado,

Quando não usar o v3

O Eleven v3 (alpha) exige mais engenharia de prompts do que nossos modelos anteriores. Quando funciona, o resultado é impressionante, mas a confiabilidade e a latência maior fazem com que ele não seja indicado para usos em tempo real ou conversação. Para esses casos, recomendamos o Eleven v2.5 Turbo/Flash.documentação completa do v3 e o FAQ.

Try it today

Faça login na interface ElevenLabs
Selecione v3 (alpha) no menu de modelos
Cole seu roteiro — use tags ou diálogos
Gerar áudio

Estamos animados para ver como você vai usar o v3 em novos projetos — de narrativas imersivas a produções cinematográficas.

Apresentando o Eleven v3 (alpha)

Por que criamos o v3

O Eleven v3 resolve essa lacuna. Ele foi criado do zero para entregar vozes que suspiram, sussurram, riem e reagem — gerando falas que parecem realmente vivas e responsivas.

Hear v3 for yourself

Como usar tags de áudio

Criando diálogos com vários falantes

v3 is our most expressive model

Preços e disponibilidade

O acesso via API e suporte no Estúdio estarão disponíveis em breve. Para acesso antecipado,

Try it today

Artigos relacionados

Apresentando o Dubbing v2

Apresentando o Music v2

Apresentando o Scribe v2

Apresentando o Scribe v2 Realtime