Salta al contenido

ElevenLabs recauda $2M y anuncia plataforma de voz IA que promete revolucionar la narración de audio

Publicado

EscucharEscucha este artículo

  • ElevenLabs lanza plataforma Beta que permite a creadores y editores narrar su contenido de larga duración
  • La ronda de financiación pre-semilla fue liderada por Credo Ventures, con la participación de Concept Ventures e inversores individuales
  • La inversión impulsará la investigación y el desarrollo de la IA


2023-01-23, Londres, Reino Unido | ElevenLabs, una startup de tecnología de voz IA, está desarrollando herramientas de síntesis de voz realistas con el objetivo a largo plazo de convertir instantáneamente audio hablado entre idiomas. Hoy, anunciaron el lanzamiento de su plataforma Beta tras recaudar $2 millones en una ronda de financiación pre-semilla liderada por Credo Ventures, con la participación de Concept Ventures y otros inversores individuales.

Nuestra plataforma permite a creadores y editores narrar contenido largo y adaptarlo al formato audio. Todas las funciones están impulsadas por un modelo de deep learning propio para síntesis de voz, que reproduce de forma realista la entonación y matices humanos, y ajusta la entonación según el contexto. En ElevenLabs también ofrecemos herramientas para

Los avances en capacidad requieren innovación, por eso ElevenLabs se considera ante todo una empresa de investigación. Gran parte de esta investigación hasta la fecha se ha centrado en desarrollar nuevos modelos de text-to-speech que se basan en alta compresión y comprensión del contexto para reproducir el habla humana de manera ultra-realista. La empresa también ha construido un nuevo modelo para clonar voces que logra una alta similitud de salida sin entrenamiento (sin ajuste fino), en muestras de tan solo 5 segundos, un logro sin precedentes. Los desarrolladores pueden acceder a todas estas características a través de la API.

Esta investigación impulsa las funciones actuales de la plataforma, pero también nos acerca a nuestro objetivo final: convertir audio hablado entre idiomas al instante. Nuestra herramienta de doblaje IA, prevista para lanzarse a finales de este año, permitirá a usuarios volver a poner voz a cualquier audio o vídeo en otro idioma, manteniendo la voz original del hablante. En ElevenLabs queremos atraer primero a clientes del sector educativo, y a largo plazo, hacer realidad el soporte de audio multilingüe bajo demanda en streaming,

Las herramientas de síntesis de voz y doblaje de la empresa son tan complementarias como oportunas: ambas prometen llevar el audio y el video a audiencias más amplias y ambas llegan en un momento en que el espacio de audio está en auge. Un grupo inicial de probadores, entre ellos creadores de YouTube, editores y desarrolladores, ya utilizan la plataforma a diario para dar voz a videos, historias y personajes, y la empresa espera que el ámbito de aplicaciones potenciales para el habla generativa solo se expanda. Los editores de noticias ya han descubierto que aumentar su presencia en audio es una excelente manera de interactuar y retener suscriptores. Pero contratar actores de doblaje es caro, al igual que hacer que los reporteros lean sus historias. Autores de libros y newsletters, e incluso desarrolladores de juegos, enfrentan desafíos similares: los primeros recurren cada vez más a narrar su propio trabajo y los segundos deben decidir si un personaje en particular justifica los costos de grabación. Aquellos que usan software de text-to-speech existente ahorran dinero pero pagan un precio diferente al comprometer la calidad. ElevenLabs insiste en que ya no es necesario comprometerse, ya que se preparan para equipar a creadores y editores con las herramientas de narración IA más avanzadas y versátiles.

“La plataforma que estamos lanzando ahora se trata de convertir texto en audio hablado de alta calidad. Queremos que la gente disfrute de su libro o newsletter favorito dando voz a todos los autores, creadores y desarrolladores que no podían permitírselo” - dice Mati Staniszewski, cofundador. “Nuestro objetivo final es que la gente disfrute de cualquier contenido que encuentre relevante e interesante, independientemente del idioma que hable” - añade Piotr Dabkowski, también cofundador.

En Credo Ventures buscamos trabajar con fundadores inteligentes y ambiciosos de la región CEE. Vimos el hambre y la chispa en los ojos de Mati y Piotr en nuestra primera reunión. Unos meses después, se están convirtiendo en un centro de investigación de tecnología de voz al nivel de OpenAI, superando los mayores desafíos en audio artificial. Sus voces sintetizadas ya son indistinguibles de las reales y este avance no solo ha reducido enormemente las barreras para generar contenido con una calidad y fidelidad sin precedentes, sino que pronto también permitirá a los creadores expandir radicalmente sus audiencias al volverse multilingües. – dice Maciek Gnutek, Socio General en Credo Ventures.

A pesar de ser común en el entretenimiento y los negocios, el audio ha sido relativamente descuidado por los avances recientes en investigación. No podríamos estar más emocionados de apoyar a Mati y Piotr durante esta era dorada para la IA generativa, y creemos que ElevenLabs es el equipo para llevar esta tecnología a las masas, una voz a la vez - dice Oliver Kicks, Principal en Concept Ventures.

Sobre ElevenLabs:
ElevenLabs es una empresa de investigación que desarrolla software de síntesis de voz IA para creadores y editoriales. Nuestras herramientas generan voces sorprendentemente realistas y pueden ajustar la entonación y las inflexiones según el contexto o las indicaciones del usuario. Nuestra plataforma busca ofrecer la calidad y versatilidad necesarias para ser la solución integral para poner voz a noticias, newsletters, libros y vídeos. Entre las funciones principales están: generación de voz a partir de texto, clonar voz IA,

Capital de riesgo proporcionado por Credo Ventures y Concept Ventures. Los inversores individuales incluyen a Peter Czaban, Tytus Cytowski, Talfan Evans, Dra. Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst y Harry Songhurst.

Contacto
press@elevenlabs.io

Artículos relacionados

Crea con el audio IA de la más alta calidad