ElevenLabs lève 2 millions de dollars et annonce une plateforme de discours IA promettant de révolutionner la narration audio

La société ouvre l'accès à la plateforme Beta conçue pour permettre aux créateurs et éditeurs de narrer du contenu long format

  • ElevenLabs lance une plateforme Beta permettant aux créateurs et éditeurs de narrer leur contenu long format
  • La levée de fonds pré-amorçage a été menée par Credo Ventures, avec la participation de Concept Ventures et d'investisseurs individuels
  • Le capital alimentera la recherche et le développement du doublage IA prévu pour plus tard cette année


2023-01-23, Londres, Royaume-Uni |ElevenLabs, une start-up de technologie de voix IA, développe des outils de synthèse vocale réalistes avec pour objectif à long terme de convertir instantanément l'audio parlé entre les langues. Aujourd'hui, ils ont annoncé le lancement de leur plateforme Beta après avoir levé 2 millions de dollars lors d'une levée de fonds pré-amorçage menée par Credo Ventures, avec la participation de Concept Ventures et d'autres investisseurs individuels.

La plateforme de l'entreprise permet aux créateurs et éditeurs de narrer du contenu long format et de s'étendre au format audio. Ses fonctionnalités sont alimentées par un modèle d'apprentissage profond développé en interne pour la synthèse vocale qui rend de manière réaliste l'intonation et les inflexions humaines, et peut ajuster la livraison en fonction du contexte. ElevenLabs propose également une suite d'outils pour le Voice Cloning et la conception de voix synthétiques, visant à offrir aux utilisateurs de nouveaux débouchés créatifs. L'entreprise travaille actuellement avec des éditeurs sélectionnés sur une station de travail dédiée à l'édition de voix off qui sera ajoutée à la plateforme début février. ElevenLabs cherche à devenir le premier narrateur IA offrant la qualité nécessaire pour donner voix aux actualités et livres audio à grande échelle.

Les avancées en capacité nécessitent de l'innovation, c'est pourquoi ElevenLabs se considère avant tout comme une entreprise de recherche. Une grande partie de cette recherche à ce jour s'est concentrée sur le développement de nouveaux modèles de text-to-speech qui reposent sur une haute compression et une compréhension du contexte pour rendre la parole humaine de manière ultra-réaliste. L'entreprise a également construit un nouveau modèle pour le Voice Cloning qui atteint une grande similarité de sortie sans entraînement (sans ajustement), sur des échantillons aussi courts que 5 secondes - un exploit inédit. Les développeurs peuvent accéder à toutes ces fonctionnalités via l'API.

Cette recherche alimente les fonctionnalités actuelles de la plateforme mais contribue également à réaliser l'objectif ultime de l'entreprise de convertir instantanément l'audio parlé entre les langues. Leur outil de doublage IA, prévu pour plus tard cette année, permettra aux utilisateurs de re-voicer automatiquement tout audio ou vidéo dans une langue différente, tout en préservant la voix originale du locuteur. ElevenLabs espère initialement attirer des clients dans le domaine de l'éducation, tandis que son objectif à long terme est de rendre le support audio multilingue à la demande une réalité dans le streaming, les livres audio, les jeux, les films et même la conversation en temps réel.

Les outils de synthèse vocale et de doublage de l'entreprise sont aussi complémentaires qu'ils sont bien chronométrés : tous deux promettent d'apporter l'audio et la vidéo à un public plus large et arrivent à un moment où l'espace audio est en plein essor. Un groupe précoce de testeurs, parmi eux des créateurs YouTube, éditeurs et développeurs, utilise déjà la plateforme quotidiennement pour donner voix à des vidéos, histoires et personnages, et l'entreprise s'attend à ce que la sphère des applications potentielles pour la parole générative ne cesse de s'étendre. Les éditeurs de nouvelles ont déjà constaté que développer leur présence audio est un excellent moyen d'engager et de fidéliser les abonnés. Mais engager des doubleurs est coûteux, tout comme faire lire leurs histoires par des journalistes. Les auteurs de livres et de newsletters, et même les développeurs de jeux, font face à des défis similaires : les premiers se tournent de plus en plus vers la narration de leur propre travail et les seconds doivent décider si un personnage particulier justifie les coûts d'enregistrement. Ceux qui utilisent des logiciels de text-to-speech existants économisent de l'argent mais paient un prix différent en compromettant la qualité. ElevenLabs insiste sur le fait qu'il n'est plus nécessaire de faire des compromis alors qu'ils se préparent à équiper les créateurs et éditeurs des outils de narration IA les plus avancés et polyvalents.

« La plateforme que nous lançons maintenant consiste à transformer le texte en audio parlé de haute qualité. Nous voulons permettre aux gens de profiter de leur livre ou newsletter préféré en donnant une voix à tous les auteurs, créateurs et développeurs qui ne pouvaient pas s'en offrir une » - dit Mati Staniszewski, co-fondateur. « Notre objectif ultime est de permettre aux gens de profiter de tout contenu qu'ils trouvent pertinent et intéressant, quelle que soit la langue qu'ils parlent » - ajoute Piotr Dabkowski, également co-fondateur.

Chez Credo Ventures, nous cherchons à travailler avec des fondateurs intelligents et ambitieux de la région CEE. Nous avons vu la faim et l'étincelle dans les yeux de Mati et Piotr lors de notre toute première rencontre. Quelques mois plus tard, ils deviennent un centre de recherche en technologie vocale de niveau OpenAI surmontant les plus grands défis de l'audio artificiel. Leurs voix synthétisées sont déjà indiscernables des vraies et cette percée a non seulement considérablement abaissé les barrières à la génération de contenu d'une qualité et d'une fidélité sans précédent, mais bientôt elle permettra également aux créateurs d'élargir radicalement leur audience en devenant multilingue. – dit Maciek Gnutek, associé général chez Credo Ventures.

Bien que courante dans le divertissement et les affaires, l'audio a été relativement négligé par les récentes avancées en recherche. Nous ne pourrions pas être plus enthousiastes à l'idée de soutenir Mati et Piotr pendant cette ère dorée de l'IA générative, et nous croyons qu'ElevenLabs est l'équipe pour apporter cette technologie au grand public, une voix à la fois - dit Oliver Kicks, principal chez Concept Ventures.

À propos de ElevenLabs :
ElevenLabs est une entreprise de recherche développant des logiciels de synthèse vocale IA pour les créateurs et éditeurs. Les outils de l'entreprise rendent la parole remarquablement réaliste et peuvent ajuster l'intonation et les inflexions en fonction du contexte ou des instructions de l'utilisateur. La plateforme de l'entreprise cherche à fournir la qualité et la polyvalence nécessaires pour devenir un guichet unique pour donner voix aux actualités, newsletters, livres et vidéos. Les fonctionnalités clés incluent : génération de parole basée sur le texte, Voice Cloning, Voice Design et, bientôt, workflow de projet pour l'édition de narration. ElevenLabs a été fondée en 2022 par Piotr, un ancien ingénieur en apprentissage automatique chez Google, et Mati, un ancien stratège de déploiement chez Palantir. L'objectif à long terme de l'entreprise est de rendre le contenu parlé universellement accessible dans n'importe quelle langue et voix.

Capital-risque fourni par Credo Ventures et Concept Ventures. Les investisseurs individuels incluent Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst et Harry Songhurst.

Contact
press@elevenlabs.io

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter