Pular para o conteúdo

ElevenLabs Levanta $2M e Anuncia Plataforma de Voz IA Prometendo Revolucionar a Narrativa em Áudio

Publicado

OuvirOuça este artigo

  • ElevenLabs lança plataforma Beta permitindo que criadores e editores narrem seu conteúdo de longa duração
  • A rodada de financiamento pré-seed foi liderada pela Credo Ventures, com participação da Concept Ventures e investidores individuais
  • O investimento vai impulsionar a pesquisa e o desenvolvimento da IA


2023-01-23, Londres, Reino Unido |A ElevenLabs, uma startup de tecnologia de voz IA, está desenvolvendo ferramentas de síntese de fala realistas com o objetivo de longo prazo de converter instantaneamente áudio falado entre idiomas. Hoje, eles anunciaram o lançamento de sua plataforma Beta após levantar $2 milhões em uma rodada de financiamento pré-seed liderada pela Credo Ventures, com participação da Concept Ventures e outros investidores individuais.

A plataforma da empresa permite que criadores e editoras narrem conteúdos longos e expandam para o formato de áudio. Os recursos são baseados em um modelo de deep learning desenvolvido internamente para síntese de voz, que reproduz de forma realista a entonação e as inflexões humanas, além de adaptar a entrega conforme o contexto. A ElevenLabs também oferece um conjunto de ferramentas para

Avanços em capacidade exigem inovação, e é por isso que a ElevenLabs se considera, antes de tudo, uma empresa de pesquisa. Grande parte dessa pesquisa até agora se concentrou no desenvolvimento de novos modelos de text-to-speech que dependem de alta compressão e compreensão de contexto para reproduzir a fala humana de forma ultra-realista. A empresa também construiu um novo modelo para clonagem de voz que alcança alta similaridade de saída sem treinamento (sem ajuste fino), em amostras de apenas 5 segundos - um feito até então inédito. Desenvolvedores podem acessar todos esses recursos via API.

Essa pesquisa impulsiona os recursos atuais da plataforma e também contribui para o objetivo final da empresa: converter instantaneamente áudios falados entre diferentes idiomas. A ferramenta de dublagem com IA, prevista para lançamento ainda este ano, vai permitir que você regrave automaticamente qualquer áudio ou vídeo em outro idioma, mantendo a voz original do locutor. Inicialmente, a ElevenLabs espera atrair clientes do setor educacional, mas o objetivo a longo prazo é tornar o suporte de áudio multilíngue sob demanda uma realidade em streaming,

As ferramentas de síntese de fala e dublagem da empresa são tão complementares quanto oportunas: ambas prometem levar áudio e vídeo a um público mais amplo e chegam em um momento em que o espaço de áudio está em expansão. Um grupo inicial de testadores, entre eles criadores do YouTube, editores e desenvolvedores, já usa a plataforma diariamente para dar voz a vídeos, histórias e personagens, e a empresa espera que a esfera de aplicações potenciais para fala generativa só se expanda. Editores de notícias já descobriram que aumentar sua presença em áudio é uma ótima maneira de engajar e reter assinantes. Mas contratar dubladores é caro, assim como ter repórteres lendo suas histórias. Autores de livros e newsletters, e até mesmo desenvolvedores de jogos, enfrentam desafios semelhantes: os primeiros cada vez mais narram seu próprio trabalho e os últimos precisam decidir se um determinado personagem justifica os custos de gravação. Aqueles que usam software de text-to-speech existente economizam dinheiro, mas pagam um preço diferente ao comprometer a qualidade. A ElevenLabs insiste que não há mais necessidade de comprometer, pois se preparam para equipar criadores e editores com as ferramentas de narrativa IA mais avançadas e versáteis.

“A plataforma que estamos lançando agora é toda sobre transformar texto em áudio falado de alta qualidade. Queremos permitir que as pessoas desfrutem de seu livro ou newsletter favorito dando voz a todos os autores, criadores e desenvolvedores que não podiam pagar por uma” - diz Mati Staniszewski, cofundador. “Nosso objetivo final é permitir que as pessoas desfrutem de qualquer conteúdo que considerem relevante e interessante, independentemente do idioma que falem” - acrescenta Piotr Dabkowski, também cofundador.

Na Credo Ventures buscamos trabalhar com fundadores inteligentes e ambiciosos da região CEE. Vimos a fome e o brilho nos olhos de Mati e Piotr em nossa primeira reunião. Alguns meses depois, eles estão se tornando um centro de pesquisa de tecnologia de fala de nível OpenAI, superando os maiores desafios em áudio artificial. Suas vozes sintetizadas já são indistinguíveis das reais e esse avanço não apenas reduziu massivamente as barreiras para gerar conteúdo com qualidade e fidelidade sem precedentes, mas em breve também permitirá que criadores expandam radicalmente seu público ao se tornarem multilíngues. – diz Maciek Gnutek, Sócio Geral na Credo Ventures.

Apesar de ser comum tanto no entretenimento quanto nos negócios, o áudio foi relativamente negligenciado pelos avanços recentes em pesquisa. Não poderíamos estar mais animados em apoiar Mati & Piotr durante esta era dourada para IA generativa, e acreditamos que a ElevenLabs é a equipe para levar essa tecnologia às massas, uma voz de cada vez - diz Oliver Kicks, Principal na Concept Ventures.

Sobre a ElevenLabs:
A ElevenLabs é uma empresa de pesquisa que desenvolve software de síntese de voz IA para criadores e editoras. Nossas ferramentas geram vozes incrivelmente naturais e podem ajustar a entonação e as inflexões conforme o contexto ou instrução do usuário. Nossa plataforma busca oferecer a qualidade e versatilidade necessárias para ser o lugar ideal para dar voz a notícias, newsletters, livros e vídeos. Os principais recursos incluem: geração de fala a partir de texto, clonar voz com IA,

Capital de risco fornecido por Credo Ventures e Concept Ventures. Investidores individuais incluem Peter Czaban, Tytus Cytowski, Talfan Evans, Dra. Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst e Harry Songhurst.

Contato
press@elevenlabs.io

Artigos relacionados

Crie com o áudio de IA da mais alta qualidade