Apresentando o Eleven v3 (alpha)

Experimente o v3

ElevenLabs Levanta $2M e Anuncia Plataforma de Voz IA Prometendo Revolucionar a Narrativa em Áudio

A empresa abre acesso à plataforma Beta projetada para permitir que criadores e editores narrem conteúdo de longa duração

  • ElevenLabs lança plataforma Beta permitindo que criadores e editores narrem seu conteúdo de longa duração
  • A rodada de financiamento pré-seed foi liderada pela Credo Ventures, com participação da Concept Ventures e investidores individuais
  • O capital impulsionará a pesquisa e desenvolvimento da dublagem IA prevista para lançamento ainda este ano


2023-01-23, Londres, Reino Unido |A ElevenLabs, uma startup de tecnologia de voz IA, está desenvolvendo ferramentas de síntese de fala realistas com o objetivo de longo prazo de converter instantaneamente áudio falado entre idiomas. Hoje, eles anunciaram o lançamento de sua plataforma Beta após levantar $2 milhões em uma rodada de financiamento pré-seed liderada pela Credo Ventures, com participação da Concept Ventures e outros investidores individuais.

A plataforma da empresa permite que criadores e editores narrem conteúdo de longa duração e expandam para o formato de áudio. Seus recursos são alimentados por um modelo de aprendizado profundo desenvolvido internamente para síntese de fala que reproduz realisticamente a entonação e inflexões humanas, e pode ajustar a entrega com base no contexto. A ElevenLabs também oferece um conjunto de ferramentas para clonagem de voz e design de vozes sintéticas, visando fornecer aos usuários novas formas criativas. A empresa está atualmente trabalhando com editores selecionados em uma estação de trabalho dedicada à edição de locução que será adicionada à plataforma no início de fevereiro. A ElevenLabs busca se tornar o primeiro narrador IA a fornecer a qualidade necessária para dar voz a notícias e audiolivros em grande escala.

Avanços em capacidade exigem inovação, e é por isso que a ElevenLabs se considera, antes de tudo, uma empresa de pesquisa. Grande parte dessa pesquisa até agora se concentrou no desenvolvimento de novos modelos de text-to-speech que dependem de alta compressão e compreensão de contexto para reproduzir a fala humana de forma ultra-realista. A empresa também construiu um novo modelo para clonagem de voz que alcança alta similaridade de saída sem treinamento (sem ajuste fino), em amostras de apenas 5 segundos - um feito até então inédito. Desenvolvedores podem acessar todos esses recursos via API.

Essa pesquisa alimenta os recursos atuais da plataforma, mas também contribui para a realização do objetivo final da empresa de converter instantaneamente áudio falado entre idiomas. Sua ferramenta de dublagem IA, prevista para lançamento ainda este ano, permitirá que os usuários revozem automaticamente qualquer áudio ou vídeo em um idioma diferente, preservando a voz original do falante. Inicialmente, a ElevenLabs espera atrair clientes na área de educação, enquanto seu objetivo de longo prazo é tornar o suporte de áudio multilíngue sob demanda uma realidade em streaming, audiolivros, jogos, filmes e até mesmo em conversas em tempo real.

As ferramentas de síntese de fala e dublagem da empresa são tão complementares quanto oportunas: ambas prometem levar áudio e vídeo a um público mais amplo e chegam em um momento em que o espaço de áudio está em expansão. Um grupo inicial de testadores, entre eles criadores do YouTube, editores e desenvolvedores, já usa a plataforma diariamente para dar voz a vídeos, histórias e personagens, e a empresa espera que a esfera de aplicações potenciais para fala generativa só se expanda. Editores de notícias já descobriram que aumentar sua presença em áudio é uma ótima maneira de engajar e reter assinantes. Mas contratar dubladores é caro, assim como ter repórteres lendo suas histórias. Autores de livros e newsletters, e até mesmo desenvolvedores de jogos, enfrentam desafios semelhantes: os primeiros cada vez mais narram seu próprio trabalho e os últimos precisam decidir se um determinado personagem justifica os custos de gravação. Aqueles que usam software de text-to-speech existente economizam dinheiro, mas pagam um preço diferente ao comprometer a qualidade. A ElevenLabs insiste que não há mais necessidade de comprometer, pois se preparam para equipar criadores e editores com as ferramentas de narrativa IA mais avançadas e versáteis.

“A plataforma que estamos lançando agora é toda sobre transformar texto em áudio falado de alta qualidade. Queremos permitir que as pessoas desfrutem de seu livro ou newsletter favorito dando voz a todos os autores, criadores e desenvolvedores que não podiam pagar por uma” - diz Mati Staniszewski, cofundador. “Nosso objetivo final é permitir que as pessoas desfrutem de qualquer conteúdo que considerem relevante e interessante, independentemente do idioma que falem” - acrescenta Piotr Dabkowski, também cofundador.

Na Credo Ventures buscamos trabalhar com fundadores inteligentes e ambiciosos da região CEE. Vimos a fome e o brilho nos olhos de Mati e Piotr em nossa primeira reunião. Alguns meses depois, eles estão se tornando um centro de pesquisa de tecnologia de fala de nível OpenAI, superando os maiores desafios em áudio artificial. Suas vozes sintetizadas já são indistinguíveis das reais e esse avanço não apenas reduziu massivamente as barreiras para gerar conteúdo com qualidade e fidelidade sem precedentes, mas em breve também permitirá que criadores expandam radicalmente seu público ao se tornarem multilíngues. – diz Maciek Gnutek, Sócio Geral na Credo Ventures.

Apesar de ser comum tanto no entretenimento quanto nos negócios, o áudio foi relativamente negligenciado pelos avanços recentes em pesquisa. Não poderíamos estar mais animados em apoiar Mati & Piotr durante esta era dourada para IA generativa, e acreditamos que a ElevenLabs é a equipe para levar essa tecnologia às massas, uma voz de cada vez - diz Oliver Kicks, Principal na Concept Ventures.

Sobre a ElevenLabs:
A ElevenLabs é uma empresa de pesquisa que desenvolve software de síntese de voz IA para criadores e editores. As ferramentas da empresa reproduzem fala incrivelmente realista e podem ajustar entonação e inflexões com base no contexto ou instrução do usuário. A plataforma da empresa busca fornecer a qualidade e versatilidade necessárias para se tornar uma solução completa para dar voz a notícias, newsletters, livros e vídeos. Os principais recursos incluem: geração de fala baseada em texto, clonagem de voz, design de voz e, em breve, fluxo de trabalho de projetos para edição de narração. A ElevenLabs foi fundada em 2022 por Piotr, um ex-engenheiro de aprendizado de máquina do Google, e Mati, um ex-estrategista de implantação da Palantir. O objetivo de longo prazo da empresa é tornar o conteúdo falado universalmente acessível em qualquer idioma e voz.

Capital de risco fornecido por Credo Ventures e Concept Ventures. Investidores individuais incluem Peter Czaban, Tytus Cytowski, Talfan Evans, Dra. Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst e Harry Songhurst.

Contato
press@elevenlabs.io

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade