¿WaveForms AI tiene algún producto disponible ahora?

Aún no. WaveForms AI sigue en fase de desarrollo, centrándose en crear modelos de audio avanzados capaces de interacciones resonantes emocionalmente en tiempo real.

¿Qué es el Test de Turing del habla y cómo se relaciona con WaveForms AI?

El Test de Turing del habla mide si los usuarios pueden distinguir entre el habla humana y la generada por IA. WaveForms AI busca superar esta prueba creando un sistema que iguale la entonación, emoción y matices humanos.

¿Cuál es la visión a largo plazo de WaveForms AI para el audio IA?

La misión de la empresa es resolver el Test de Turing del habla y desarrollar Inteligencia General Emocional (EGI), permitiendo que la IA entienda y responda a las emociones humanas de manera natural y significativa.

¿Cómo es diferente WaveForms AI de otras empresas de audio IA?

A diferencia de los sistemas tradicionales de Texto a Voz, WaveForms AI está construyendo modelos de audio de extremo a extremo que procesan el sonido de manera nativa. Este enfoque busca capturar toda la profundidad emocional y contextual de las conversaciones humanas. El audio IA contextual de ElevenLabs ha estado en vivo desde enero de 2023.

¿Quién fundó WaveForms AI y cuál es su experiencia?

WaveForms AI fue cofundada por Alexis Conneau, un exingeniero de OpenAI, y Coralie Lemaitre, quien anteriormente trabajó en estrategia de producto en Google. Juntos, aportan experiencia en IA y desarrollo de productos a la empresa.

Salta al contenido

Inicia sesión Regístrate

Contactar ventas Ir a la app

Blog

Waveforms IA y la prueba de Turing vocal

Última actualización 6 mar 2026 • 10 minutos de lectura

Nueva startup de veteranos de OpenAI y Google comparte planes ambiciosos para el audio IA, con productos aún en desarrollo

A wavy line made of small, colorful dots on a dark blue background.

A dark blue background with a wavy line of small, multicolored dots in shades of blue and white.

Saber más Contactar con ventas

Hoy, WaveForms AI, fundada por exveteranos de OpenAI y Google, anunció su misión de desarrollar sistemas de audio IA que puedan emular el habla humana de manera indistinguible. El CEO Alexis Conneau enfatizó su objetivo de superar el “Test de Turing del habla”, apuntando a un puntaje de preferencia del 50% donde los usuarios no puedan discernir entre el habla humana y la generada por IA. La empresa está actualmente en fase de desarrollo, con planes de revelar productos específicos el próximo año.

Nota: WaveForms AI compartió planes para el audio IA, con productos aún en desarrollo. Mientras tanto, el audio IA de ElevenLabs está disponible hoy, ofreciendo calidad de producción.

¿Qué es el Test de Turing del habla?

El Test de Turing del habla es un referente para los sistemas de audio IA, que mide si los humanos pueden distinguir entre el habla generada por IA y la humana. Un sistema pasa esta prueba cuando logra un puntaje de preferencia del 50%, lo que significa que los oyentes no pueden decir si están escuchando a una persona o a una IA.ElevenLabs ya ha logrado avances significativos en alcanzar este nivel de indistinguibilidad, con voces ampliamente reconocidas por su realismo humano.

Cómo WaveForms AI está abordando el Test de Turing del habla

WaveForms AI, fundada por exveteranos de OpenAI y Google, tiene como objetivo crear sistemas de audio IA capaces de una comunicación fluida y similar a la humana. Liderada por Alexis Conneau, la startup se centra en desarrollar modelos que no solo repliquen el habla humana, sino que también capturen matices emocionales, haciendo que las interacciones se sientan más naturales y atractivas.Los modelos de

Texto a Voz

A blue sphere with a black arrow pointing to the right, next to a white card with a blue and black abstract wave design.

¿Qué es un puntaje de preferencia en los sistemas de habla IA?

El puntaje de preferencia mide la indistinguibilidad del habla generada por IA respecto a la humana. Un puntaje del 50% significa que los oyentes no muestran una preferencia clara, marcando efectivamente la paridad entre ambos.ElevenLabs ha logrado consistentemente altos puntajes de preferencia, con una adopción líder en la industria por parte de creadores, medios, y organizaciones de accesibilidad.

¿Por qué importa el matiz emocional en el audio IA?

Los sistemas de voz IA actuales a menudo pierden sutilezas emocionales, limitando su capacidad para transmitir empatía o interactuar de manera significativa. WaveForms AI afirma abordar esto con sus LLM de Audio, que procesan el audio de manera nativa para capturar contexto y emoción, permitiendo una comunicación más rica.ElevenLabs ya ha demostrado la importancia del matiz emocional, ofreciendo herramientas que permiten a los usuarios ajustar el tono, la expresividad y el ritmo para adaptarse a cualquier contexto.

¿Cómo es diferente WaveForms AI de los sistemas de audio IA existentes?

A diferencia de los sistemas tradicionales de ElevenLabs ha sido pionero en avances en Profundidad emocional y flexibilidadElevenLabs ha sido pionera en avances en

¿Qué desafíos conlleva lograr el Test de Turing del habla?

Desarrollar sistemas de habla IA indistinguibles plantea desafíos tanto técnicos como éticos. Conneau destaca riesgos como que los usuarios formen vínculos con personajes de IA y las implicaciones sociales más amplias del creciente realismo de la IA. Abordar estos problemas de manera responsable es un enfoque clave para WaveForms AI.ElevenLabs ha implementado salvaguardas, como políticas de voz “no-go” y una moderación de contenido rigurosa, para navegar estos desafíos de manera responsable mientras ofrece tecnología de vanguardia.

AI Safety at ElevenLabs

Aplicaciones de sistemas IA diseñados para superar el Test de Turing del habla

WaveForms AI imagina su tecnología siendo utilizada en un amplio espectro de aplicaciones, incluyendo educación, soporte al cliente y entretenimiento. La capacidad de crear interacciones de voz similares a las humanas abre posibilidades para experiencias más inmersivas y empáticas en estas áreas.ElevenLabs ya está impulsando aplicaciones en estos campos, desde herramientas educativas accesibles hasta localización de medios multilingües, mostrando lo que es posible con la tecnología actual.

El futuro de los sistemas de audio IA

Aunque los productos de WaveForms AI aún están en desarrollo, su ambición de redefinir las interacciones de audio IA ha atraído una atención significativa, incluyendo 40 millones de dólares en financiación inicial liderada por Andreessen Horowitz. A medida que la empresa trabaja para resolver el Test de Turing del habla, su potencial para redefinir cómo interactuamos con la tecnología es inmenso.ElevenLabs continúa liderando en la configuración del futuro del audio IA, ofreciendo soluciones que están transformando industrias y satisfaciendo las necesidades de los usuarios en este momento.

Cómo se compara el Audio de WaveForms AI con ElevenLabs

Buscando apoyar numerosos casos de uso de generación de audio en el futuro, WaveForms AI parece que podría convertirse en un buen kit de herramientas de audio IA de propósito general. Por ahora, sigue siendo un anuncio de producto. ElevenLabs, por otro lado, está disponible hoy, ofreciendo calidad de producción y personalización.

Evaluemos brevemente cómo se compara WaveForms AI en áreas clave como Texto a Voz y generación de sonido.

Texto a Voz

ElevenLabs se destaca como el claro líder de la industria en tecnología de

Soporte para más de 70 idiomas con acentos auténticos y matices culturales
Inteligencia emocional avanzada que responde al contexto textual
Control sobre las características de la voz
Habla de alta calidad, similar a la humana, que mantiene la consistencia en contenido de larga duración
Una extensa biblioteca de voces de sonido natural
La capacidad de clonar y personalizar voces

La tecnología de ElevenLabs ya ofrece resultados confiables y listos para producción que cumplen con los estándares profesionales. Su enfoque especializado produce consistentemente voces más naturales que capturan los matices sutiles del habla humana.

Efectos de Sonido

ElevenLabs ya ofrece un enfoque más simplificado y preciso para la generación de efectos de sonido. ElevenLabs ofrece:

Generación instantánea de cuatro muestras diferentes para cada prompt
Control preciso a través de descripciones detalladas de texto
Salida de alta calidad adecuada para proyectos comerciales
Una biblioteca completa de efectos de sonido comunes
La capacidad de crear efectos distintivos directamente desde descripciones de texto

ElevenLabs ofrece excelencia especializada tanto en la generación de voz como de efectos de sonido. Como uno de los mejores generadores de efectos de sonido IA, produce resultados confiables y listos para producción que mejor sirven a las necesidades de creadores de contenido profesionales.

Cómo usar ElevenLabs para Texto a Voz

Transforma tu contenido en locuciones de calidad profesional con estos sencillos pasos:

Regístrate: Crea una cuenta gratuita o de pago con ElevenLabs
Elige tu voz: Selecciona de una diversa biblioteca de voces de sonido natural
Introduce tu texto: Pega o escribe tu guion en la interfaz
Personaliza los ajustes: Ajusta la velocidad, el tono y el énfasis para que coincidan con tus necesidades
Previsualiza y genera: Escucha una muestra y genera tu salida de audio final
Descarga: Descarga tu locución de alta calidad

Reflexiones finales

La aparición de herramientas de audio IA como WaveForms y ElevenLabs marca una evolución emocionante en la creación de contenido. Sin embargo, aunque WaveForms AI anunció ambiciones impresionantes en la generación de sonido experimental y manipulación de audio, aún no está disponible para su uso.

ElevenLabs, por otro lado, está disponible y listo para producción. También es la solución líder actualmente en el mercado para la generación de

¿Listo para probar la tecnología IA de ElevenLabs? Regístrate hoy para comenzar.

Texto a Voz

Preguntas frecuentes

Descubre artículos del equipo de ElevenLabs

Customer Stories

Tutore deploys conversational agents for corporate language training using ElevenLabs

90% of Tutore’s placement interviews are now conducted by AI agents, accelerating onboarding and reducing costs

Product

Product

Introducing Music Finetunes in ElevenCreative

Generate individual vocals, instruments or full tracks with stylistic consistency using a fine-tuned version of our Music model.

Crea con el audio IA de la más alta calidad

Contacta con Ventas Regístrate