Apresentando o Eleven v3 (alpha)

Experimente o v3

WaveForms AI anuncia missão de passar no Teste de Turing de fala

Nova startup de veteranos da OpenAI e Google compartilha planos ambiciosos para áudio com IA, com produtos ainda em desenvolvimento

A dark blue background with a wavy line of small, multicolored dots in shades of blue and white.

Hoje, a WaveForms AI, fundada por ex-veteranos da OpenAI e Google, anunciou sua missão de desenvolver sistemas de áudio com IA que possam emular a fala humana de forma indistinguível. O CEO Alexis Conneau enfatizou seu objetivo de passar no “Teste de Turing de Fala”, visando uma pontuação de preferência de 50%, onde os usuários não conseguem discernir entre fala humana e gerada por IA. A empresa está atualmente na fase de desenvolvimento, com planos de revelar produtos específicos no próximo ano.

Note: WaveForms AI shared plans for audio AI, with products still in development. Meanwhile, ElevenLabs' audio AI is available today, delivering production-grade quality.

O que é o Teste de Turing de Fala?

O Teste de Turing de Fala é um parâmetro para sistemas de áudio com IA, medindo se os humanos conseguem distinguir entre fala gerada por IA e fala humana. Um sistema passa neste teste quando atinge uma pontuação de preferência de 50%, significando que os ouvintes não conseguem dizer se estão ouvindo uma pessoa ou uma IA.A ElevenLabs já fez avanços significativos em alcançar esse nível de indistinguibilidade, com vozes amplamente reconhecidas por seu realismo semelhante ao humano.

Como a WaveForms AI está enfrentando o Teste de Turing de Fala

A WaveForms AI, fundada por ex-veteranos da OpenAI e Google, visa criar sistemas de áudio com IA capazes de comunicação fluida e semelhante à humana. Liderada por Alexis Conneau, a startup foca no desenvolvimento de modelos que não apenas replicam a fala humana, mas também capturam nuances emocionais, tornando as interações mais naturais e envolventes.Os modelos de Text-to-Speech da ElevenLabs estabeleceram o padrão para combinar velocidade e expressividade, já entregando fala com nuances e consciência contextual em escala.

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

Nossa tecnologia de texto para fala com IA oferece milhares de vozes de alta qualidade e naturais em mais de 70 idiomas. Se você está procurando uma solução gratuita de texto para fala ou um gerador de voz IA premium para projetos comerciais, nossas ferramentas e APIs TTS podem atender às suas necessidades

O que é uma pontuação de preferência em sistemas de fala com IA?

A pontuação de preferência mede a indistinguibilidade da fala gerada por IA em relação à fala humana. Uma pontuação de 50% significa que os ouvintes não mostram preferência clara, efetivamente marcando a paridade entre os dois.A ElevenLabs consistentemente alcançou altas pontuações de preferência, com adoção líder na indústria por criadores, mídia, e organizações de acessibilidade.

Por que a nuance emocional importa no áudio com IA?

Os sistemas de voz com IA atuais muitas vezes perdem sutilezas emocionais, limitando sua capacidade de transmitir empatia ou engajar de forma significativa. A WaveForms AI afirma abordar isso com seus Audio LLMs, que processam áudio nativamente para capturar contexto e emoção, permitindo uma comunicação mais rica.A ElevenLabs já demonstrou a importância da nuance emocional, oferecendo ferramentas que permitem aos usuários ajustar tom, expressividade e ritmo para se adequar a qualquer contexto.

Screenshot of an audiobook editing interface with highlighted text and two book cover images titled "Discover Daily" and "Dune."

Seu fluxo de trabalho completo para transformar livros em audiolivros e roteiros em podcasts

Como a WaveForms AI é diferente dos sistemas de áudio com IA existentes?

Ao contrário dos sistemas tradicionais de Text-to-Speech, os Audio LLMs de ponta a ponta da WaveForms AI visam capturar a profundidade e complexidade da interação humana. Seu foco na Inteligência Emocional Geral (EGI) introduz uma camada socioemocional à IA, priorizando conexão e empatia sobre funcionalidade básica.A ElevenLabs tem sido pioneira em avanços em profundidade emocional e flexibilidade, com ferramentas projetadas para lidar com cenários complexos do mundo real, sendo acessíveis e disponíveis hoje.

Quais desafios vêm com a conquista do Teste de Turing de Fala?

Desenvolver sistemas de fala com IA indistinguíveis apresenta desafios técnicos e éticos. Conneau destaca riscos como usuários formando vínculos com personagens de IA e as implicações sociais mais amplas do realismo crescente da IA. Abordar essas questões de forma responsável é um foco chave para a WaveForms AI.A ElevenLabs construiu salvaguardas, como políticas de voz “proibidas” e moderação rigorosa de conteúdo, para navegar responsavelmente por esses desafios enquanto entrega tecnologia de ponta.

Aplicações de sistemas de IA projetados para passar no Teste de Turing de Fala

A WaveForms AI imagina sua tecnologia sendo usada em uma ampla gama de aplicações, incluindo educação, suporte ao cliente e entretenimento. A capacidade de criar interações de voz semelhantes às humanas abre possibilidades para experiências mais imersivas e empáticas nessas áreas.A ElevenLabs já está impulsionando aplicações nesses campos, desde ferramentas de educação acessíveis até localização de mídia multilíngue, mostrando o que é possível com a tecnologia de hoje.

Two men speaking into microphones during a recording session, with audio editing software displayed on a screen in the background.

Traduza áudio e vídeo preservando a emoção, o timing, o tom e as características únicas de cada interlocutor

O futuro dos sistemas de áudio com IA

Enquanto os produtos da WaveForms AI ainda estão em desenvolvimento, sua ambição de redefinir interações de áudio com IA atraiu atenção significativa, incluindo $40 milhões em financiamento inicial liderado por Andreessen Horowitz. À medida que a empresa trabalha para resolver o Teste de Turing de Fala, seu potencial para remodelar como interagimos com a tecnologia é imenso.A ElevenLabs continua a liderar na definição do futuro do áudio com IA, entregando soluções que estão transformando indústrias e atendendo às necessidades dos usuários agora.

Flowchart diagram with black and white nodes labeled "USER," "SPEECH TO TEXT," "TEXT TO SPEECH," "AGENT," "LLM," "MONITORING," and "FUNCTION CALLING" connected by curved lines on a blue gradient background.

Adicione voz aos seus agentes na web, mobile ou telefonia em minutos. Nossa API em tempo real oferece baixa latência, total configurabilidade e escalabilidade perfeita.

Como o áudio da WaveForms AI se compara ao da ElevenLabs

Buscando apoiar numerosos casos de uso de geração de áudio no futuro, a WaveForms AI parece que pode se tornar um bom kit de ferramentas de áudio com IA de uso geral. Por enquanto, permanece um anúncio de produto. A ElevenLabs, por outro lado, está disponível hoje, oferecendo qualidade de produção e personalização.

Vamos avaliar brevemente como a WaveForms AI se compara em áreas-chave como Text-to-Speech e geração de som.

Text-to-Speech

A ElevenLabs é a líder clara da indústria em tecnologia de Text-to-Speech, oferecendo:

  • Suporte para 32 idiomas com sotaques autênticos e nuances culturais
  • Inteligência emocional avançada que responde ao contexto textual
  • Controle sobre características da voz
  • Fala de alta qualidade, semelhante à humana, que mantém consistência em conteúdo de longa duração
  • Uma extensa biblioteca de vozes com som natural
  • A capacidade de clonar e personalizar vozes

A tecnologia da ElevenLabs já entrega saída confiável e pronta para produção que atende aos padrões profissionais. Sua abordagem especializada produz consistentemente vozes mais naturais que capturam as sutilezas da fala humana.

Sound Effects

A ElevenLabs já oferece uma abordagem mais simplificada e precisa para geração de efeito sonoro. A ElevenLabs oferece:

  • Geração instantânea de quatro amostras diferentes para cada prompt
  • Controle preciso através de descrições textuais detalhadas
  • Saída de alta qualidade adequada para projetos comerciais
  • Uma biblioteca abrangente de efeitos sonoros comuns
  • A capacidade de criar efeitos distintos diretamente de descrições textuais

A ElevenLabs entrega excelência especializada tanto na geração de voz quanto de efeito sonoro. Como um dos melhores geradores de efeito sonoro com IA, produz saída confiável e pronta para produção que melhor atende às necessidades dos criadores de conteúdo profissionais.

Como usar a ElevenLabs para Text-to-Speech

Transforme seu conteúdo em locuções de qualidade profissional com estas etapas simples:

  1. Cadastre-se: Crie uma conta gratuita ou paga com a ElevenLabs
  2. Escolha sua voz: Selecione de uma biblioteca diversificada de vozes com som natural
  3. Insira seu texto: Cole ou digite seu roteiro na interface
  4. Personalize as configurações: Ajuste a velocidade, tom e ênfase para atender às suas necessidades
  5. Pré-visualize e gere: Ouça uma amostra e gere seu áudio final
  6. Baixe: Baixe sua locução de alta qualidade

Considerações finais

O surgimento de ferramentas de áudio com IA como WaveForms e ElevenLabs marca uma evolução empolgante na criação de conteúdo. No entanto, enquanto a WaveForms AI anunciou ambições impressionantes em geração de som experimental e manipulação de áudio, ainda não está disponível para uso.

A ElevenLabs, por outro lado, está disponível e em nível de produção. É também a solução líder atualmente no mercado para geração de voz e efeitos sonoros com AI Text-to-Speech.

Pronto para testar a tecnologia de IA da ElevenLabs? Cadastre-se hoje para começar.

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

Nossa tecnologia de texto para fala com IA oferece milhares de vozes de alta qualidade e naturais em mais de 70 idiomas. Se você está procurando uma solução gratuita de texto para fala ou um gerador de voz IA premium para projetos comerciais, nossas ferramentas e APIs TTS podem atender às suas necessidades

Perguntas Frequentes

Ainda não. A WaveForms AI está na fase de desenvolvimento, focando na criação de modelos de áudio avançados capazes de interações emocionais em tempo real.

O Teste de Turing de Fala mede se os usuários conseguem distinguir entre fala humana e fala gerada por IA. A WaveForms AI visa passar neste teste criando um sistema que corresponda à entonação, emoção e nuances humanas.

A missão da empresa é resolver o Teste de Turing de Fala e desenvolver a Inteligência Emocional Geral (EGI), permitindo que a IA entenda e responda às emoções humanas de maneiras naturais e significativas.

Ao contrário dos sistemas tradicionais de Text-to-Speech, a WaveForms AI está construindo modelos de áudio de ponta a ponta que processam som nativamente. Essa abordagem visa capturar toda a profundidade emocional e contextual das conversas humanas. A IA de áudio contextual da ElevenLabs está ativa desde janeiro de 2023.

A WaveForms AI foi co-fundada por Alexis Conneau, um ex-engenheiro da OpenAI, e Coralie Lemaitre, que anteriormente trabalhou em estratégia de produto no Google. Juntos, eles trazem expertise em IA e desenvolvimento de produtos para a empresa.

Explore artigos da equipe ElevenLabs

ElevenLabs

Crie com o áudio IA da mais alta qualidade