Detectar audio generado por ElevenLabs con SynthID
- Escrito por
- Daniel Fletcher
- Publicado
- Última actualización
EscucharEscucha este artículo
Las personas deben saber cuándo están interactuando con IA. Antes, el contenido generado con IA era fácil de identificar: sonaba robótico o tenía seis dedos. Pero con las mejoras recientes en los modelos, cada vez es más difícil distinguirlo.
A medida que mejoran nuestros modelos de voz, música y efectos de sonido, queremos que cualquiera pueda identificar si un audio ha sido generado por IA sin necesidad de herramientas especializadas. Por eso colaboramos con Google DeepMind en SynthID: una marca de agua digital incrustada directamente en el audio generado por ElevenLabs. Estas marcas de agua son inaudibles para las personas y permanecen incluso si recortas los clips, aceleras el audio, eliminas los metadatos o conviertes el archivo a otro formato. Esta semana hemos empezado a incluir SynthID en Texto a Voz para usuarios gratuitos, y en las próximas semanas ampliaremos la cobertura a todo el audio generado con ElevenLabs. Además, estas marcas de agua se pueden detectar con nuestro nuevo
Más transparencia y responsabilidad
Siempre hemos prohibido el uso de nuestras herramientas para engañar, manipular o acosar, y nuestros sistemas ya están diseñados para rastrear el contenido hasta el usuario que lo generó, para poder actuar si es necesario. Marcar el audio con SynthID refuerza nuestro compromiso con la transparencia y la responsabilidad, permitiendo que cualquiera pueda verificar el origen de un clip de audio.
En algunos casos, la gente solo querrá saber si un contenido ha sido generado por IA. En otros, será importante saber de qué plataforma de IA proviene. Por eso hoy lanzamos nuestra propia página gratuita de Detector de Audio de ElevenLabs que permite verificar si un audio ha sido generado por ElevenLabs. Esto se basa en nuestro Clasificador de Voz IA, pero utiliza SynthID para incrustar la atribución directamente en el audio de forma más robusta. Este mecanismo es clave para que podamos rendir cuentas públicamente sobre el uso de nuestra tecnología y actuar si alguien consigue saltarse nuestras medidas de seguridad y crear deepfakes realistas.
Cada vez más países exigen que el contenido generado por IA esté marcado como sintético en un formato legible por máquina. Marcar el audio con SynthID complementa nuestro ecosistema de procedencia y cumplimiento normativo, que también incluye credenciales C2PA. Además, nos entusiasma la posibilidad de añadir SynthID a la lista de soft bindings de C2PA para que el audio al que se le haya eliminado las credenciales pueda recuperarlas.
Solución de marca de agua de alta calidad
SynthID funciona ocultando un patrón de sonido en los clips de audio. Este patrón es inaudible para el oído humano, pero nuestro Detector de Audio de ElevenLabs puede detectarlo. Cada archivo de audio tiene su propio patrón único, y estos patrones resisten transformaciones habituales como compresión, recortes o cambios de velocidad.
SynthID ha funcionado muy bien en nuestras pruebas y cumple todos nuestros requisitos técnicos:
- No añade latencia al tiempo de respuesta (TTFB)
- Alta tasa de detección y bajo número de falsos positivos
- Resistente a recortes y otras transformaciones habituales en internet
- Inaudible para las personas, sin pérdida de calidad de audio
- No se puede copiar en audio que no haya sido generado por ElevenLabs
Seguiremos colaborando con el equipo de SynthID en Google DeepMind para avanzar en la marca de agua de audio más avanzada.
Próximos pasos
Marcar el audio con agua es, sobre todo, una cuestión de transparencia y responsabilidad, pero también abre nuevas posibilidades para nuestros productos. Ya existe un mercado consolidado de credenciales digitales: los estudios las usan para proteger la propiedad intelectual y creadores las utilizan para asegurarse de que reciben ingresos cuando su trabajo se reutiliza. En el futuro, las marcas de agua podrían permitir que creadores y titulares de derechos incluyan su propia metadata en el contenido, facilitando la detección y gestión de material protegido que se redistribuya en plataformas como YouTube, Instagram o TikTok.
La marca de agua es solo una parte de nuestro compromiso con la transparencia. A medida que nuestros modelos sean más potentes y realistas, nuestra infraestructura de responsabilidad debe evolucionar al mismo ritmo. Cuanto más podamos atribuir el contenido a su origen, más fiable será el ecosistema de información que compartimos.
%20(1).png&w=3840&q=80)



