
ElevenLabs vs. Cartesia (June 2025)
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Apresentando o Eleven v3 (alpha)
Experimente o v3Londres, Reino Unido - A ElevenLabs, líder mundial em software de áudio com IA, lançou hoje um novo modelo de geração de voz multilíngue capaz de produzir voz IA com "riqueza emocional" precisa em 30 idiomas.
Esse avanço, totalmente baseado em pesquisas internas, permitirá que criadores produzam conteúdo de áudio nativo para mercados internacionais em toda a Europa, Ásia e Oriente Médio. A ElevenLabs passou os últimos dezoito meses analisando marcas de fala humana, construindo novos mecanismos para entender o contexto e transmitir emoções na geração de fala, além de criar vozes novas e únicas.
O novo modelo Eleven Multilingual v2, ao inserir texto na plataforma ElevenLabs de Text to Speech, permite identificar automaticamente cerca de 30 idiomas escritos e gerar fala neles com um nível de autenticidade sem precedentes.
Enquanto isso, independentemente de a voz usada ser sintética ou clonada, as características únicas da voz do falante serão mantidas em todos os idiomas, incluindo seu sotaque original. Isso significa que a mesma voz pode dar vida ao conteúdo em 30 idiomas diferentes.
Este lançamento segue o lançamento público da clonagem de voz profissional para todos os criadores de conteúdo na plataforma. Esta atualização do produto, lançada juntamente com recursos adicionais de segurança, permite que os usuários criem uma cópia digital perfeita de sua voz; uma versão virtual
indistinguível do original. O lançamento de hoje significa que sua voz pode falar em quase 30 idiomas oferecidos pelo modelo multilíngue.
Os idiomas suportados incluem coreano, holandês, turco, sueco, indonésio, vietnamita, filipino, ucraniano, grego, tcheco, finlandês, romeno, dinamarquês, búlgaro, malaio, húngaro, norueguês, eslovaco, croata, árabe clássico e tâmil. Eles se juntam aos idiomas já disponíveis, incluindo inglês, polonês, alemão, espanhol, francês, italiano, hindi e português.
A ElevenLabs também confirmou hoje, após o lançamento dos últimos recursos e melhorias contínuas da plataforma, que a plataforma sairá oficialmente do beta. Essa transição representa um momento crucial no compromisso da empresa em fornecer ferramentas confiáveis e avançadas para seus mais de um milhão de usuários globais.
Olhando para o futuro, a ElevenLabs planeja oferecer um mecanismo que permita aos usuários compartilhar vozes na plataforma e aproveitar o desenvolvimento de novas vozes, promovendo oportunidades de colaboração entre humanos e IA.
Mati Staniszewski, CEO e cofundador da ElevenLabs, comentou:
"A ElevenLabs começou com o sonho de tornar todo o conteúdo acessível globalmente em qualquer idioma e com qualquer voz. O lançamento do Eleven Multilingual v2 nos aproximou um passo de transformar esse sonho em realidade e tornar as vozes IA de qualidade humana disponíveis em todos os sotaques.
"Nossas ferramentas de geração de texto para fala ajudam a nivelar o campo de jogo e oferecem capacidades de voz falada de alta qualidade para todos os criadores de conteúdo. Esses benefícios agora se estendem a aplicações multilíngues em quase 30 idiomas. Esperamos, no final, cobrir mais idiomas e vozes com a ajuda da IA, removendo barreiras linguísticas para o conteúdo. Acreditamos na ElevenLabs que esses avanços em acessibilidade promoverão, em última análise, maior criatividade, inovação e diversidade".
Ao reduzir o custo e os recursos necessários para criar conteúdo de áudio de alta qualidade em vários idiomas, a ElevenLabs oferece a empresas e criadores a capacidade de produzir conteúdo mais criativo e acessível que ressoe entre culturas e idiomas.
A ferramenta de geração de fala multilíngue oferece a desenvolvedores de jogos e editores independentes novas oportunidades para traduzir experiências de jogos e conteúdo de áudio para públicos internacionais, conectando-se com jogadores e ouvintes em seus próprios idiomas sem comprometer a qualidade ou precisão da fala.
Da mesma forma, instituições educacionais agora têm os meios para fornecer aos alunos conteúdo de áudio preciso nos idiomas-alvo imediatamente, melhorando as habilidades de compreensão e pronúncia, além de atender a diferentes métodos de ensino e necessidades de aprendizagem de estudantes internacionais.
Criadores de todos os tipos podem usar a ferramenta da ElevenLabs para melhorar a acessibilidade do conteúdo para pessoas com deficiências visuais ou necessidades de aprendizagem adicionais, complementando o conteúdo visual com fala disponível em vários idiomas.
Sua coleção inicial de ferramentas de áudio com IA, revelada em janeiro de 2023, incluía a capacidade de transformar qualquer texto em fala através de uma seleção de vozes sintéticas pré-desenhadas e a capacidade de criar uma cópia da sua voz. A ferramenta de síntese de fala multilíngue é mais um passo à frente na missão da ElevenLabs de tornar todo o conteúdo acessível globalmente em qualquer idioma e com qualquer voz.
Muitos setores e áreas criativas já adotaram essa tecnologia, incluindo a capacitação de autores independentes para criar audiolivros, dar voz a personagens secundários em videogames, apoiar deficientes visuais no acesso a conteúdo escrito online e operar a primeira estação de rádio de IA do mundo. A ElevenLabs também fez parceria com uma série de criadores de conteúdo e estúdios líderes, incluindo geradores de vídeo com IA D-ID, um dos maiores editores de audiolivros do mundo Storytel, a plataforma de vídeo científica de acesso aberto ScienceCast que condensa artigos de pesquisa publicados no arXiv, a plataforma global de criadores de conteúdo TheSoul Publishing, e desenvolvedores de jogos incríveis como Embark Studios e Paradox Interactive, além da plataforma de mídia MNTN.
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Unlocking the Power of AI Voiceovers for eLearning