Black Friday

Resgatar

WaveForms AI anuncia missão de passar no Teste de Turing de fala

Nova startup de veteranos da OpenAI e Google compartilha planos ambiciosos para áudio com IA, com produtos ainda em desenvolvimento

A dark blue background with a wavy line of small, multicolored dots in shades of blue and white.

Hoje, a WaveForms AI, fundada por ex-veteranos da OpenAI e Google, anunciou sua missão de desenvolver sistemas de áudio com IA que possam emular a fala humana de forma indistinguível. O CEO Alexis Conneauenfatizou seu objetivo de passar no “Teste de Turing de Fala”, visando uma pontuação de preferência de 50% onde os usuários não conseguem discernir entre fala humana e gerada por IA. A empresa está atualmente na fase de desenvolvimento, com planos de revelar produtos específicos no próximo ano.

Nota: A WaveForms AI compartilhou planos para áudio com IA, com produtos ainda em desenvolvimento. Enquanto isso, o áudio com IA da ElevenLabs está disponível hoje, oferecendo qualidade de produção.

O que é o Teste de Turing de Fala?

O Teste de Turing de Fala é um parâmetro para sistemas de áudio com IA, medindo se os humanos conseguem distinguir entre fala gerada por IA e fala humana. Um sistema passa neste teste quando atinge uma pontuação de preferência de 50%, significando que os ouvintes não conseguem dizer se estão ouvindo uma pessoa ou uma IA.A ElevenLabs já fez avanços significativos em alcançar esse nível de indistinguibilidade, com vozes amplamente reconhecidas por seu realismo semelhante ao humano.

Como a WaveForms AI está enfrentando o Teste de Turing de Fala

A WaveForms AI, fundada por ex-veteranos da OpenAI e Google, visa criar sistemas de áudio com IA capazes de comunicação fluida e semelhante à humana. Liderada por Alexis Conneau, a startup foca no desenvolvimento de modelos que não apenas replicam a fala humana, mas também capturam nuances emocionais, tornando as interações mais naturais e envolventes.Os modelos deText-to-Speech da ElevenLabs estabeleceram o padrão para combinar velocidade e expressividade, já entregando fala com nuances e consciência contextual em escala.

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

Crie vozes naturais com nosso sistema de Text to Speech (TTS), desenvolvido para narração de alta qualidade, jogos, vídeos e acessibilidade. Vozes expressivas, suporte multilíngue e integração com API facilitam a expansão de projetos pessoais para fluxos de trabalho empresariais.

O que é uma pontuação de preferência em sistemas de fala com IA?

A pontuação de preferência mede a indistinguibilidade da fala gerada por IA em relação à fala humana. Uma pontuação de 50% significa que os ouvintes não mostram preferência clara, efetivamente marcando a paridade entre os dois.A ElevenLabs tem consistentemente alcançado altas pontuações de preferência, com adoção líder na indústria porcriadores, mídia, e organizações de acessibilidade.

Por que a nuance emocional importa em áudio com IA?

Os sistemas de voz com IA atuais muitas vezes perdem sutilezas emocionais, limitando sua capacidade de transmitir empatia ou engajar de forma significativa. A WaveForms AI afirma abordar isso com seus LLMs de Áudio, que processam áudio de forma nativa para capturar contexto e emoção, permitindo uma comunicação mais rica.A ElevenLabs já demonstrou a importância da nuance emocional, oferecendo ferramentas que permitem aos usuários ajustar tom, expressividade e ritmo para se adequar a qualquer contexto.

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

Seu fluxo de trabalho completo para editar vídeos e áudios, adicionar locuções e música, transcrever para texto e publicar produções narradas e legendadas

Como a WaveForms AI é diferente dos sistemas de áudio com IA existentes?

Ao contrário dos sistemas tradicionais deText-to-Speech, os LLMs de Áudio de ponta a ponta da WaveForms AI visam capturar a profundidade e complexidade da interação humana. Seu foco na Inteligência Emocional Geral (EGI) introduz uma camada socioemocional à IA, priorizando conexão e empatia sobre funcionalidade básica.A ElevenLabs tem sido pioneira em avanços emprofundidade emocional e flexibilidade, com ferramentas projetadas para lidar com cenários complexos do mundo real, sendo acessíveis e disponíveis hoje.

Quais desafios vêm com a conquista do Teste de Turing de Fala?

Desenvolver sistemas de fala com IA indistinguíveis apresenta desafios técnicos e éticos. Conneau destaca riscos como usuários formarem vínculos com personagens de IA e as implicações sociais mais amplas do realismo crescente da IA. Abordar essas questões de forma responsável é um foco chave para a WaveForms AI.A ElevenLabs construiu salvaguardas, como políticas de voz “proibidas” e moderação rigorosa de conteúdo, para navegar responsavelmente por esses desafios enquanto entrega tecnologia de ponta.

Aplicações de sistemas de IA projetados para passar no Teste de Turing de Fala

A WaveForms AI imagina sua tecnologia sendo usada em um amplo espectro de aplicações, incluindo educação, suporte ao cliente e entretenimento. A capacidade de criar interações de voz semelhantes às humanas abre possibilidades para experiências mais imersivas e empáticas nessas áreas.A ElevenLabs já está impulsionando aplicações nesses campos, desde ferramentas de educação acessíveis até localização de mídia multilíngue, mostrando o que é possível com a tecnologia de hoje.

Two men speaking into microphones during a recording session, with audio editing software displayed on a screen in the background.

Traduza áudio e vídeo preservando a emoção, o timing, o tom e as características únicas de cada interlocutor

O futuro dos sistemas de áudio com IA

Enquanto os produtos da WaveForms AI ainda estão em desenvolvimento, sua ambição de redefinir interações de áudio com IA atraiu atenção significativa, incluindo $40 milhões em financiamento inicial liderado por Andreessen Horowitz. À medida que a empresa trabalha para resolver o Teste de Turing de Fala, seu potencial para remodelar como interagimos com a tecnologia é imenso.A ElevenLabs continua a liderar na definição do futuro do áudio com IA, entregando soluções que estão transformando indústrias e atendendo às necessidades dos usuários agora.

landing page

Adicione voz aos seus agentes na web, mobile ou telefonia em minutos. Nossa API em tempo real oferece baixa latência, total configurabilidade e escalabilidade perfeita.

Como o áudio da WaveForms AI se compara ao da ElevenLabs

Buscando apoiarnumerosos casos de uso de geração de áudio no futuro, a WaveForms AI parece que pode se tornar uma boa ferramenta de IA de áudio de uso geral. Por enquanto, permanece um anúncio de produto. A ElevenLabs, por outro lado, está disponível hoje, oferecendo qualidade de produção e personalização.

Vamos avaliar brevemente como a WaveForms AI se compara em áreas-chave comoText-to-Speech e geração de som.

Text-to-Speech

A ElevenLabs é a líder clara da indústria emText-to-Speech tecnologia, oferecendo:

  • Suporte para mais de 70 idiomas com sotaques autênticos e nuances culturais
  • Inteligência emocional avançada que responde ao contexto textual
  • Controle sobre características de voz
  • Fala de alta qualidade, semelhante à humana, que mantém consistência em conteúdo de longa duração
  • Uma extensa biblioteca de vozes com som natural
  • A capacidade de clonar e personalizar vozes

A tecnologia da ElevenLabs já entregasaída confiável e pronta para produção que atende aos padrões profissionais. Sua abordagem especializada produz consistentemente vozes mais naturais que capturam as sutilezas da fala humana.

Sound Effects

A ElevenLabs já oferece uma abordagem mais simplificada e precisa para a geração deefeitos sonoros. A ElevenLabs oferece:

  • Geração instantânea de quatro amostras diferentes para cada prompt
  • Controle preciso através de descrições textuais detalhadas
  • Saída de alta qualidade adequada para projetos comerciais
  • Uma biblioteca abrangente de efeitos sonoros comuns
  • A capacidade de criar efeitos distintos diretamente de descrições textuais

A ElevenLabs entrega excelência especializada tanto na geração de voz quanto de efeitos sonoros. Como um dos melhores geradores de efeitos sonoros com IA, produz uma saída confiável e pronta para produção que melhor atende às necessidades dos criadores de conteúdo profissionais.

Como usar a ElevenLabs para Text-to-Speech

Transforme seu conteúdo em locuções de qualidade profissional com estas etapas simples:

  1. Cadastre-se: Crie uma conta gratuita ou paga com a ElevenLabs
  2. Escolha sua voz: Selecione de uma biblioteca diversificada de vozes com som natural
  3. Insira seu texto: Cole ou digite seu roteiro na interface
  4. Personalize as configurações: Ajuste a velocidade, tom e ênfase para atender às suas necessidades
  5. Pré-visualize e gere: Ouça uma amostra e gere seu áudio final
  6. Baixe: Baixe sua locução de alta qualidade

Considerações finais

O surgimento de ferramentas de áudio com IA como WafeForms e ElevenLabs marca uma evolução empolgante na criação de conteúdo. No entanto, enquanto a WaveForms AI anunciou ambições impressionantes em geração de som experimental e manipulação de áudio, ainda não está disponível para uso.

A ElevenLabs, por outro lado, está disponível e pronta para produção. É também a solução líder atualmente no mercado parageração de voz e efeitos sonoros com IA.

Pronto para testar a tecnologia de IA da ElevenLabs?Cadastre-se hoje para começar.

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

Crie vozes naturais com nosso sistema de Text to Speech (TTS), desenvolvido para narração de alta qualidade, jogos, vídeos e acessibilidade. Vozes expressivas, suporte multilíngue e integração com API facilitam a expansão de projetos pessoais para fluxos de trabalho empresariais.

Perguntas Frequentes

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade