ElevenLabs sai da fase beta e lança o Eleven Multilingual v2 – um modelo de IA fundamental para 30 idiomas

Publicado: 22 de ago. de 2023

OuvirOuça este artigo

0:00

0:000:00

ElevenLabs, a plataforma de IA linguística, dá um passo importante na missão de superar barreiras de idioma em conteúdos ao lançar um novo modelo de deep learning que oferece recursos multilíngues em 30 idiomas – Eleven Multilingual v2
Essa novidade vai permitir que empresas de mídia, desenvolvedores de jogos, editoras e autores independentes do mundo todo aumentem muito a acessibilidade dos seus conteúdos
Essas novas capacidades, que chegam junto com uma série de recursos e melhorias desde o lançamento da plataforma em janeiro, também marcam o fim oficial da fase beta da empresa
A missão da ElevenLabs é tornar todo conteúdo acessível em qualquer idioma e com qualquer voz

Londres, Reino Unido– ElevenLabs, líder mundial em software de reconhecimento de fala por IA, lançou hoje um novo modelo multilíngue para geração de voz, capaz de criar áudios com IA cheios de emoção em 30 idiomas.

O desenvolvimento, totalmente baseado em pesquisa própria, vai permitir que desenvolvedores produzam conteúdos de áudio localizados para mercados internacionais na Europa, Ásia e Oriente Médio. Nos últimos 18 meses, a ElevenLabs analisou marcadores da fala humana, desenvolveu novos mecanismos para entender contexto e expressar emoções na geração de voz, além de sintetizar vozes novas e únicas.

Com o Eleven Multilingual v2 o novo modelo consegue reconhecer automaticamente quase 30 idiomas escritos ao receber texto na plataforma de Text to Speech da ElevenLabs, e gerar fala nesses idiomas com um nível de autenticidade nunca visto.

Seja usando uma voz sintética ou clonada, as características únicas da voz do locutor são mantidas em todos os idiomas, incluindo o sotaque original. Isso significa que é possível dar vida a conteúdos em 30 idiomas diferentes usando a mesma voz.

Esse lançamento vem após o lançamento público do Professional

é praticamente indistinguível da original. Com o lançamento de hoje, sua voz pode falar em quase 30 idiomas disponíveis no modelo multilíngue.

Entre os idiomas suportados estão: coreano, holandês, turco, sueco, indonésio, vietnamita, filipino, ucraniano, grego, tcheco, finlandês, romeno, dinamarquês, búlgaro, malaio, húngaro, norueguês, eslovaco, croata, árabe padrão e tâmil. Esses idiomas se somam aos já disponíveis: inglês, polonês, alemão, espanhol, francês, italiano, hindi e português.

Após o lançamento de novos recursos e melhorias constantes na plataforma, a ElevenLabs também confirmou hoje que saiu oficialmente da fase beta. Essa transição marca um momento importante no compromisso da empresa de oferecer ferramentas confiáveis e inovadoras para mais de 1 milhão de usuários no mundo todo.

Para o futuro, a ElevenLabs planeja lançar um mecanismo que permita aos usuários compartilhar suas vozes na plataforma e se beneficiar do desenvolvimento de novos dados de áudio, incentivando a colaboração entre pessoas e IA.

Mati Staniszewski, CEO e fundador da ElevenLabs, comentou:

"A ElevenLabs nasceu do sonho de tornar todo conteúdo acessível em qualquer idioma e com qualquer voz. Com o lançamento do Eleven Multilingual v2, estamos mais perto de realizar esse sonho, tornando vozes IA com qualidade humana disponíveis em qualquer dialeto.

Nossas ferramentas de síntese de voz abrem caminho para todos os criadores, oferecendo opções de alta qualidade. Agora, esses benefícios chegam também a aplicações multilíngues em quase 30 idiomas. No futuro, esperamos, com a ajuda da IA, cobrir ainda mais idiomas e vozes, eliminando barreiras linguísticas nos conteúdos. Nós, da ElevenLabs, acreditamos que esses avanços em acessibilidade vão gerar mais criatividade, inovação e diversidade."

A ElevenLabs reduz os custos e recursos necessários para criar conteúdos de áudio de alta qualidade em vários idiomas. Empresas e criadores podem produzir conteúdos mais criativos e acessíveis, que conectam pessoas além de barreiras culturais e linguísticas.

Para desenvolvedores e editoras de jogos independentes, a ferramenta de geração de voz multilíngue abre novas possibilidades para traduzir experiências de jogo e conteúdos de áudio para públicos internacionais, permitindo se comunicar com jogadores e ouvintes no idioma deles, sem perder qualidade ou precisão na fala.

Da mesma forma, instituições de ensino agora podem oferecer aos alunos conteúdos de áudio precisos no idioma desejado, melhorando a compreensão oral e a pronúncia, além de atender diferentes estilos de ensino e necessidades de estudantes internacionais.

Criadores de todos os tipos podem usar a ferramenta da ElevenLabs para aumentar a acessibilidade dos seus conteúdos para pessoas com deficiência visual ou necessidades de aprendizagem, enriquecendo conteúdos visuais com fala em vários idiomas.

A primeira suíte de ferramentas de voz com IA, lançada em janeiro de 2023, já permitia transformar qualquer texto em fala, usando vozes sintéticas pré-definidas ou criando um clone da própria voz. A ferramenta de síntese de voz multilíngue é mais um passo na missão da ElevenLabs de tornar todo conteúdo acessível em qualquer idioma e com qualquer voz.

A tecnologia já é usada em vários setores criativos. Ela permite que autores independentes criem audiolivros, deem voz a personagens secundários em jogos, facilitem o acesso de pessoas com deficiência visual a conteúdos online e até operem a primeira rádio com IA do mundo. A ElevenLabs também fez parcerias com grandes criadores de conteúdo e estúdios, incluindo o gerador de vídeos com IA D-ID, Storytel, uma das maiores editoras de audiolivros do mundo, a plataforma de vídeos abertos ScienceCast, cuja ferramenta de geração de vídeos reúne pesquisas científicas publicadas no arXiv, a principal plataforma de criação de conteúdo do mundo TheSoul Publishingestúdios de jogos incríveis como Embark Studiose Paradox Interactivee a plataforma de mídia MNTN.

ElevenLabs sai da fase beta e lança o Eleven Multilingual v2 – um modelo de IA fundamental para 30 idiomas

Artigos relacionados

Apresentando o Scribe v2 Realtime

Eleven Music chegou

Apresentando o Voice Design v3

Apresentando o Eleven v3 (alpha)