- ElevenLabs ha recaudado una ronda Serie B de $80M liderada conjuntamente por Andreessen Horowitz, Nat Friedman, Daniel Gross, y con la participación de Sequoia Capital, Smash Capital, SV Angel, BroadLight Capital y Credo Ventures para fortalecer su posición como líder en voz IA.
- La empresa también está revelando hoy un conjunto de nuevos productos, incluyendo Dubbing Studio, Voice Library marketplace, una vista previa de una Mobile Reader App, y nuevos modelos con mejor velocidad y cobertura de idiomas.
- Desde su lanzamiento, la tecnología de ElevenLabs ha mejorado la accesibilidad del contenido a nivel global en sectores como la economía de creadores, publicación, Conversational AI, entretenimiento, educación y accesibilidad, con su adopción por millones llevando a la empresa a estatus de unicornio.
22 de enero / Global - ElevenLabs, una empresa de investigación en tecnología de voz, ha recaudado una ronda Serie B de $80M liderada conjuntamente por Andreessen Horowitz, Nat Friedman, Daniel Gross, y con la participación de Sequoia Capital, SV Angel, Smash Capital, BroadLight Capital y Credo Ventures, para consolidar su posición como líder global en investigación de voz IA y despliegue de productos.
Desde su lanzamiento público, ElevenLabs ha liderado la industria en síntesis de voz natural, permitiendo a usuarios crear y diseñar voces IA en una amplia gama de idiomas y acentos, con la capacidad de transmitir una variedad de emociones y entonaciones. Desde su lanzamiento, los usuarios de ElevenLabs han generado más de 100 años de audio, mientras la empresa creció de 5 a 40 empleados. Hoy, la tecnología de ElevenLabs está siendo utilizada por empleados en 41% de las empresas Fortune 500.
La tecnología de ElevenLabs ha sido adoptada en numerosos sectores. Ha empoderado a creadores para mejorar la experiencia del público con locuciones y AI Dubbing, ampliado el acceso a la educación y proporcionado soluciones innovadoras en publicación de audiolibros, entretenimiento y uso personal, incluyendo mejorar la accesibilidad. Esta financiación se utilizará para refinar aún más la oferta de productos de la empresa mientras se asegura el despliegue seguro de la tecnología IA.
Además del anuncio de la Serie B de hoy, ElevenLabs también está presentando varios desarrollos de productos nuevos, que estarán disponibles en las próximas semanas:
- Un nuevo Dubbing Studioworkflow permite a los usuarios doblar películas enteras, así como generar y editar sus transcripciones, traducciones y códigos de tiempo, proporcionando un control adicional sobre la producción de contenido. Estas capacidades complementan la función de AI Dubbing ya existente que permite la localización automática de video de extremo a extremo en 29 idiomas.
- Un Voice Library marketplace que proporcionará una plataforma segura para que los usuarios ganen con versiones IA de sus propias voces. Los usuarios pueden crear su réplica profesional de voz IA, verificarla y compartirla a través de Voice Library. Cuando otros usan estas voces verificadas, los creadores originales reciben compensación. Los usuarios siempre mantienen el control sobre la disponibilidad de su voz y los términos de compensación. El marketplace ya está generando ingresos para un pequeño grupo de usuarios alfa.
- Una vista previa de la Mobile App reader que permite la conversión instantánea de texto y URLs en audio, facilitando a los usuarios el acceso a contenido en otro medio mientras están en movimiento. Como prueba introductoria, la app estará disponible de forma gratuita durante los primeros tres meses y los usuarios podrán registrarse para acceso anticipado a través de una lista de espera.
A lo largo de 2023, ElevenLabs también ha expandido su presencia en múltiples sectores, incluyendo publicación, videojuegos, medios y verticales conversacionales, además de forjar asociaciones B2B con grandes casas de medios, entre ellas:
- Publicación: Storytel, The Washington Post, Rheinische Post, Curio
- Conversational AI: FlowGPT, SimpleTalk AI, Ollang, VoiceDrop, Vana
- Medios y Entretenimiento: Wondershare Filmora, Futuri Media, TheSoul Publishing
- Videojuegos: Paradox Interactive, NetEase, Inworld AI
Estos últimos lanzamientos de productos y asociaciones siguen a un período en el que ElevenLabs ha expandido continuamente su conjunto de herramientas, todas desarrolladas a partir de investigación interna. Los lanzamientos han incluido: Síntesis de Voz para conversión text-to-speech realista, junto con un modelo Turbo optimizado para latencia; Voice Design y Voice Cloning para crear voces personalizadas; Speech to Speech para transformar una voz en otra. La empresa también lanzó su herramienta líder en la industria AI Dubbing capaz de traducir automáticamente audio y video a 29 idiomas mientras preserva la voz y emociones del hablante original. La empresa también ampliará pronto los modelos Turbo y Speech to Speech, que actualmente están disponibles en inglés, a un conjunto más amplio de idiomas.
Basándose en la investigación que impulsa estas características, ElevenLabs también ha trabajado en el desarrollo de herramientas avanzadas para workflows más complejos, como Studio para publicación, y el Dubbing Studio para localización de video. Studio simplifica la edición, estructuración, navegación y generación de contenido de formato largo para editores, y Dubbing Studio ayuda a preparar contenido para audiencias globales proporcionando control práctico sobre transcripción, traducción y sincronización de secuencias.
La empresa también ha desarrollado productos orientados a la comunidad como Voice Library - un entorno para compartir voces generadas por IA. Anteriormente limitado a compartir voces artificiales creadas con la herramienta Voice Design, Voice Library ahora permite a los usuarios compartir sus propias réplicas de voz verificadas hechas con Professional Voice Cloning como parte del recién introducido Voice Library marketplace, y ganar dinero cuando otros las usan. Para asegurar la seguridad e integridad del marketplace, ElevenLabs utiliza su tecnología Professional Voice Cloning para crear réplicas de voz de alta fidelidad. Antes de compartir una voz, los usuarios deben pasar una verificación Voice Captcha leyendo un prompt de texto dentro de un tiempo específico para confirmar que su voz coincide con las muestras de entrenamiento. Este proceso, junto con la moderación y aprobación manual del equipo de ElevenLabs, asegura que se compartan y moneticen voces auténticas y verificadas por el usuario, creando un entorno más seguro y confiable.
Una prioridad central para ElevenLabs es el desarrollo seguro y responsable de la IA, con un enfoque en habilitar la detección para asegurar que todo el contenido generado por IA sea claramente identificable. La empresa lanzó un AI Speech Classifier el año pasado; una herramienta que puede verificar si una muestra de audio contiene contenido generado por ElevenLabs. Este año, la empresa trabajará en mejorar las capacidades del Classifier para cubrir más modelos de voz IA, así como asociarse con otras plataformas de distribución para una implementación más amplia. ElevenLabs está desarrollando activamente salvaguardas adicionales para mejorar la seguridad en el dominio público.
Con esta inversión de Serie B, ElevenLabs pretende consolidar su posición como líder global en investigación de voz IA y despliegue de productos. El capital se destinará a avanzar en la investigación, expandir la infraestructura, desarrollar nuevos productos para verticales específicos y mejorar las medidas de seguridad para asegurar un desarrollo responsable y ético de la tecnología IA.
Piotr Dąbkowski, CTO de ElevenLabs, añade:
“La dedicación de nuestro equipo ya ha tenido un impacto duradero en la voz IA. Esta nueva financiación nos permite asumir desafíos aún mayores y centrarnos en mantener nuestra ventaja competitiva en investigación y desarrollo de productos.”
Mati Staniszewski concluye:
“Nuestra ambición sigue siendo la misma: transformar cómo interactuamos con el contenido rompiendo barreras de idioma y comunicación. Estamos construyendo tecnología de vanguardia para hacer que el contenido sea accesible en todos los idiomas - y voces - para permitir que todos se conecten con la información e historias que importan. Nuestro progreso hasta ahora es un testimonio de nuestro dedicado equipo e inversores, y aunque todavía es solo el comienzo de nuestro viaje, juntos estamos ayudando a dar forma al futuro de la accesibilidad y la comunicación.”