Apresentando o Eleven v3 (alpha)

Experimente o v3

ElevenLabs sai da fase beta e lança Eleven Multilingual v2: um modelo de voz IA para 30 idiomas

  • A plataforma de IA vocal ElevenLabs dá um passo decisivo em seus esforços para eliminar barreiras linguísticas no conteúdo, com o lançamento de um novo modelo de aprendizado profundo que suporta capacidades multilíngues em 30 idiomas: Eleven Multilingual v2
  • Esse avanço permitirá que empresas de mídia, desenvolvedores de jogos, editores e criadores independentes de todo o mundo melhorem significativamente a acessibilidade de seu conteúdo
  • Essas novas funcionalidades, que seguem uma série de novidades e melhorias desde o lançamento da plataforma em janeiro, também marcam o fim oficial da fase beta da empresa
  • A missão da ElevenLabs é tornar todo o conteúdo universalmente acessível em qualquer idioma e com qualquer voz

Londres, Reino Unido - ElevenLabs, líder mundial em software de IA vocal, lançou hoje um novo modelo de geração de voz multilíngue capaz de produzir sons de IA "ricos em emoções" com precisão em 30 idiomas.

Esse avanço, totalmente baseado em pesquisas internas, permitirá que criadores produzam conteúdos de áudio localizados para mercados internacionais na Europa, Ásia e Oriente Médio. A ElevenLabs passou os últimos 18 meses analisando as características da fala humana, criando novos mecanismos para entender o contexto e transmitir emoções na geração de fala, além de sintetizar vozes novas e únicas.

Com o Eleven Multilingual v2, quando um texto é inserido na plataforma de síntese vocal ElevenLabs, o novo modelo pode identificar automaticamente cerca de 30 idiomas escritos e gerar fala com um nível de autenticidade sem precedentes.

Além disso, seja uma voz sintética ou clonada, as características únicas da voz do locutor são preservadas em todos os idiomas, incluindo seu sotaque original. Assim, a mesma voz pode ser usada para dar vida a um conteúdo em 30 idiomas diferentes.

Esse lançamento segue o lançamento do clonagem vocal profissional para todos os criadores da plataforma. Essa atualização do produto, que foi lançada junto com funcionalidades de segurança adicionais, permite que os usuários criem uma cópia digital perfeita de sua própria voz; que é praticamente

impossível de distinguir da original. Com essa nova versão, sua voz poderá se expressar nos cerca de 30 idiomas oferecidos pelo modelo multilíngue.

Os idiomas suportados incluem: coreano, holandês, turco, sueco, indonésio, vietnamita, filipino, ucraniano, grego, tcheco, finlandês, romeno, dinamarquês, búlgaro, malaio, húngaro, norueguês, eslovaco, croata, árabe clássico e tâmil. Eles se juntam aos idiomas anteriormente disponíveis, incluindo inglês, polonês, alemão, espanhol, francês, italiano, hindi e português.

Após os lançamentos recentes de funcionalidades e melhorias contínuas na plataforma, a ElevenLabs também confirmou hoje que a plataforma está oficialmente saindo de sua fase beta. Essa transição marca um ponto de virada no compromisso da empresa em fornecer ferramentas confiáveis e de ponta para seus mais de um milhão de usuários em todo o mundo.

No futuro, a ElevenLabs planeja introduzir um mecanismo que permita aos usuários compartilhar suas vozes na plataforma e se beneficiar do desenvolvimento de novos sons, promovendo assim as possibilidades de colaboração entre humanos e inteligência artificial.

Mati Staniszewski, CEO e cofundador da ElevenLabs, comenta:

"A ElevenLabs foi criada com o objetivo de tornar todo conteúdo universalmente acessível em qualquer idioma e com qualquer voz. Com o lançamento do Eleven Multilingual v2, estamos um pouco mais perto de nosso objetivo, que é tornar esse sonho uma realidade e disponibilizar vozes de IA de qualidade humana em todos os dialetos.

"Nossas ferramentas de síntese vocal permitem colocar todos em pé de igualdade e oferecer a todos os criadores capacidades de áudio vocal de qualidade superior. Esses benefícios agora se estendem a aplicações multilíngues em cerca de 30 idiomas. A longo prazo, esperamos cobrir ainda mais idiomas e vozes com a ajuda da IA, e eliminar as barreiras linguísticas ao conteúdo. Na ElevenLabs, acreditamos que esses avanços em acessibilidade promoverão, a longo prazo, a criatividade, a inovação e a diversidade."

Reduzindo os custos e recursos necessários para criar conteúdo de áudio de alta qualidade em vários idiomas, a ElevenLabs permite que empresas e criadores produzam conteúdo mais imaginativo e acessível que considera todas as culturas e idiomas.

Para desenvolvedores e editores de jogos independentes, a ferramenta de geração de voz multilíngue permite traduzir experiências de jogo e conteúdo de áudio para públicos internacionais, conectando-se com jogadores e ouvintes em seu próprio idioma sem comprometer a qualidade ou precisão do áudio falado.

Da mesma forma, as instituições de ensino agora têm os meios para fornecer instantaneamente aos alunos conteúdo de áudio preciso nos idiomas-alvo, o que fortalece as habilidades de compreensão e pronúncia de idiomas e atende aos diferentes estilos de ensino e necessidades de aprendizagem dos estudantes internacionais.

Criadores de todos os tipos podem usar a ferramenta da ElevenLabs para melhorar a acessibilidade do conteúdo para pessoas com deficiência visual ou que tenham necessidades de aprendizagem adicionais, complementando o conteúdo visual com discurso disponível em vários idiomas.

Seu primeiro conjunto de ferramentas vocais de IA, revelado em janeiro de 2023, incluía a capacidade de transformar qualquer texto em fala com uma seleção de vozes sintéticas pré-concebidas e a possibilidade de criar um clone de sua própria voz. A ferramenta de síntese vocal multilíngue é um novo passo na missão da ElevenLabs de tornar todo conteúdo universalmente acessível em qualquer idioma e com qualquer voz.

A tecnologia já foi adotada em muitos setores e verticais criativos, incluindo permitir que autores independentes criem audiolivros, dar voz a personagens secundários em videogames, ajudar pessoas com deficiência visual a acessar conteúdos escritos online e alimentar a primeira estação de rádio IA do mundo. A ElevenLabs também se associou a uma gama de criadores e estúdios de conteúdo de destaque, incluindo os geradores de vídeos de IA D-ID, um dos maiores editores de audiolivros do mundo , Storytel, a plataforma de vídeos científicos de acesso aberto ScienceCast cuja ferramenta de geração de vídeos reúne documentos de pesquisa científica publicados no arXiv, a principal plataforma mundial de criação de conteúdo TheSoul Publishing, desenvolvedores de jogos incríveis como Embark Studios e Paradox Interactive, e a plataforma multimídia MNTN.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade