Apresentando o Eleven v3 (alpha)

Experimente o v3

Olá da ElevenLabs

Construindo a próxima geração de voz IA

O que é a ElevenLabs?

Somos uma empresa de pesquisa em tecnologia de voz. Usamos inteligência artificial (IA) e aprendizado de máquina (ML) para trazer as ferramentas mais poderosas de síntese de fala, conversão de voz e dublagem para criadores de conteúdo, plataformas web e estúdios de produção em diversos setores.

O que são dublagem, conversão de voz e síntese de fala?

Dublagem é um processo para fornecer a um filme uma trilha sonora em um idioma diferente. O que as pessoas geralmente querem dizer é substituir as vozes dos atores originais pelas de intérpretes falando outro idioma - também conhecido como "re-voicing" - tradicionalmente uma tarefa cara e demorada. Na Eleven, usamos IA para fazer isso automaticamente, preservando as vozes originais dos atores em diferentes idiomas.

Conversão de voz permite que uma pessoa fale com a voz de outra. Também conhecida como voice cloning, é um processo de codificação de uma voz alvo e sobreposição em uma voz fonte. Falar na voz de outra pessoa levanta preocupações éticas, pois pode ser usado para fins nefastos, mas na Eleven nos comprometemos a usar nossa tecnologia apenas com o consentimento do indivíduo ou para fins de demonstração de uma forma que não gere conflitos de interesse.

Text-to-speech (TTS) é a base de toda tecnologia de síntese de fala. A tecnologia TTS melhorou radicalmente ao longo dos anos, embora ainda soe frequentemente robótica. Isso porque pronunciar palavras fluentemente por si só é insuficiente para dar à fala qualidade humana. É o tom e o ritmo orientados pela intenção que vêm de entender o que está sendo dito que a fazem soar natural. Novamente, na Eleven, tentamos alcançar exatamente isso: expondo nosso modelo a uma riqueza de dados de fala humana, treinamos para entender tanto o contexto lógico quanto emocional das falas e ajustar a entrega de acordo. Também podemos substituir a entrega padrão para qualquer efeito desejado.

Como a Eleven é diferente?

Nossa ferramenta de dublagem permite que você re-voze automaticamente um vídeo em outro idioma, preservando as características distintivas da voz do falante original. Somos a primeira empresa com a missão de fornecer ferramentas dedicadas para tradução de fala para fala que preservam a identidade do falante entre idiomas. Nossa tecnologia permite que você produza faixas de áudio multilíngues e localizadas, faladas com fluência e vocabulário nativos, na sua própria voz, com seu padrão de fala preservado, e sem a necessidade de re-editar os visuais. Na Eleven imaginamos um futuro onde todo o conteúdo falado seja acessível em qualquer idioma em streaming, filmes, podcasts, audiolivros, jogos, publicidade, assim como, eventualmente, conversação em tempo real. Esperamos ajudar a trazer esse futuro, proporcionando uma experiência muito mais imersiva e contínua do que a legendagem jamais poderia. A primeira versão da nossa ferramenta oferece dublagem do inglês para o espanhol europeu.

Alcançar qualidade de produção em dublagem automática só é possível se fizermos avanços em duas áreas adjacentes de tecnologia de voz - conversão de voz e geração de fala, para as quais também desenvolvemos ferramentas dedicadas, em paralelo com nosso software de dublagem. Nossos produtos aqui suportam tanto voice cloning quanto fala sintética. Vamos além de entregar vozes com som humano, não robóticas (ou até mesmo fala indistinguível da original quando treinada em um conjunto de amostras). Podemos ajustar precisamente o tom das falas para qualquer efeito desejado, bem como gerar inúmeras iterações dentro de um estilo particular de entrega - assim como um ator faria.

Em resumo, nossa ferramenta de dublagem busca permitir que o conteúdo existente alcance um público mais amplo. Nossas ferramentas de geração de fala e conversão de voz buscam otimizar o tempo e o custo envolvidos na produção de novo conteúdo enquanto maximizam o valor de produção. Através da dublagem, esperamos principalmente permitir que os criadores ampliem seu alcance e ajudem o público em potencial a descobrir conteúdo que considerem relevante e cativante, independentemente do idioma que entendam.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade