Apresentando o Eleven v3 (alpha)

Experimente o v3

ElevenLabs sai da fase Beta e lança Eleven Multilingual v2 – um modelo de linguagem de IA para 30 idiomas

  • ElevenLabs, a plataforma de IA linguística, dá um passo radical à frente em seu esforço para superar barreiras linguísticas em conteúdos, lançando um novo modelo de deep learning que suporta capacidades multilíngues em 30 idiomas – Eleven Multilingual v2
  • Esse desenvolvimento permitirá que empresas de mídia, desenvolvedores de jogos, editoras e autores independentes em todo o mundo melhorem drasticamente a acessibilidade de seus conteúdos
  • Essas novas capacidades, que seguem uma série de novas funções e melhorias desde o lançamento da plataforma em janeiro, também marcam o fim oficial da fase Beta da empresa
  • A missão da ElevenLabs é tornar todos os conteúdos universalmente acessíveis em qualquer idioma e com qualquer voz

Londres, Reino Unido ElevenLabs, o principal fornecedor mundial de software de reconhecimento de fala por IA, lançou hoje um novo modelo multilíngue de geração de voz, capaz de gerar áudios de IA ricos em emoções em 30 idiomas.

O desenvolvimento, totalmente baseado em pesquisa própria, permitirá que desenvolvedores produzam conteúdos de áudio localizados para mercados internacionais na Europa, Ásia e Oriente Médio. Nos últimos 18 meses, a ElevenLabs analisou marcadores da linguagem humana, desenvolveu novos mecanismos para compreensão de contexto e expressão de emoções na geração de fala, e sintetizou novas vozes únicas.

Com o Eleven Multilingual v2 o novo modelo pode reconhecer automaticamente quase 30 idiomas escritos ao inserir texto na plataforma Text to Speech da ElevenLabs e gerar fala nesses idiomas com um grau de autenticidade sem precedentes.

Independentemente de uma voz sintética ou clonada ser usada, as características únicas das vozes dos falantes são mantidas em todos os idiomas, incluindo o sotaque original. Isso significa que a mesma voz pode dar vida a conteúdos em 30 idiomas diferentes.

Essa introdução segue o lançamento público do Professional Voice Cloning para todos os criativos na plataforma. Com essa atualização de produto, lançada junto com recursos adicionais de segurança, os usuários podem criar uma cópia digital perfeita de sua própria voz que

é praticamente indistinguível do original. Com o lançamento de hoje, sua voz pode falar em quase 30 idiomas disponíveis no modelo multilíngue.

Os idiomas suportados incluem: Coreano, Holandês, Turco, Sueco, Indonésio, Vietnamita, Filipino, Ucraniano, Grego, Tcheco, Finlandês, Romeno, Dinamarquês, Búlgaro, Malaio, Húngaro, Norueguês, Eslovaco, Croata, Árabe Padrão e Tâmil. Esses idiomas complementam os já disponíveis Inglês, Polonês, Alemão, Espanhol, Francês, Italiano, Hindi e Português.

Após a introdução de novas funções e a melhoria contínua da plataforma, a ElevenLabs também confirmou hoje que a plataforma saiu oficialmente da fase Beta. Essa transição marca um momento decisivo no compromisso da empresa em fornecer ferramentas confiáveis e de ponta para seus mais de 1 milhão de usuários em todo o mundo.

Para o futuro, a ElevenLabs planeja introduzir um mecanismo que permitirá aos usuários compartilhar suas vozes na plataforma e se beneficiar do desenvolvimento de novos dados de áudio, promovendo a colaboração entre humanos e IA.

Mati Staniszewski, CEO e fundador da ElevenLabs, comentou:

“A ElevenLabs foi fundada com o sonho de tornar todos os conteúdos universalmente acessíveis em qualquer idioma e com qualquer voz. Com o lançamento do Eleven Multilingual v2, estamos um passo mais perto de realizar esse sonho, tornando vozes de qualidade humana em qualquer dialeto disponíveis.

Nossas ferramentas de síntese de voz abrem caminho para todos os criativos, oferecendo opções de síntese de voz de alta qualidade. Esses benefícios agora se estendem a aplicações multilíngues em quase 30 idiomas. Finalmente, esperamos, com a ajuda da IA, cobrir ainda mais idiomas e vozes, eliminando barreiras linguísticas para conteúdos. Nós, da ElevenLabs, acreditamos que esses avanços em acessibilidade levarão, em última análise, a mais criatividade, inovação e diversidade.”

A ElevenLabs reduz os custos e recursos necessários para criar conteúdos de áudio de alta qualidade em vários idiomas. Empresas e criativos podem assim produzir conteúdos mais inventivos e acessíveis, que ressoam além das fronteiras culturais e linguísticas.

Para desenvolvedores e editores de jogos independentes, a ferramenta de geração de voz multilíngue oferece novas possibilidades de traduzir experiências de jogo e conteúdos de áudio para um público internacional, comunicando-se com jogadores e ouvintes em seu próprio idioma, sem comprometer a qualidade ou precisão da saída de voz.

Da mesma forma, instituições educacionais agora têm a oportunidade de fornecer aos alunos conteúdos de áudio precisos na língua-alvo imediatamente, melhorando a compreensão e pronúncia, e atendendo aos diferentes estilos de ensino e necessidades de aprendizagem de estudantes internacionais.

Criativos de todos os tipos podem usar a ferramenta da ElevenLabs para melhorar a acessibilidade de seus conteúdos para pessoas com deficiência visual ou necessidades de aprendizagem adicionais, enriquecendo conteúdos visuais com fala em vários idiomas.

A primeira suíte de ferramentas de voz por IA, apresentada em janeiro de 2023, oferece a capacidade de transformar qualquer texto em fala, utilizando uma seleção de vozes sintéticas predefinidas e a possibilidade de criar um clone da própria voz. A ferramenta de síntese de voz multilíngue é mais um passo na missão da ElevenLabs de tornar todos os conteúdos universalmente acessíveis em qualquer idioma e com qualquer voz.

A tecnologia já é utilizada em uma variedade de setores criativos. Ela permite que autores independentes escrevam audiolivros, dubladores de personagens secundários em videogames, facilitem o acesso de pessoas com deficiência visual a conteúdos escritos online e operem a primeira estação de rádio por IA do mundo. A ElevenLabs também firmou parcerias com uma série de criadores de conteúdo e estúdios líderes, incluindo o gerador de vídeo por IA D-ID, Storytel, uma das maiores editoras de audiolivros do mundo, a plataforma de vídeo de acesso aberto ScienceCast, cuja ferramenta de geração de vídeo agrega trabalhos de pesquisa científica publicados no arXiv, a principal plataforma de criação de conteúdo do mundo TheSoul Publishing, incríveis desenvolvedores de jogos como Embark Studios e Paradox Interactive e a plataforma de mídia MNTN.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade