ElevenLabs lève 2 millions de dollars et annonce une plateforme de discours IA promettant de révolutionner la narration audio
- Publié
ÉcouterÉcouter cet article
- ElevenLabs lance une plateforme Beta permettant aux créateurs et éditeurs de narrer leur contenu long format
- La levée de fonds pré-amorçage a été menée par Credo Ventures, avec la participation de Concept Ventures et d'investisseurs individuels
- Ce financement va soutenir la recherche et le développement de l’IA
2023-01-23, Londres, Royaume-Uni |ElevenLabs, une start-up de technologie de voix IA, développe des outils de synthèse vocale réalistes avec pour objectif à long terme de convertir instantanément l'audio parlé entre les langues. Aujourd'hui, ils ont annoncé le lancement de leur plateforme Beta après avoir levé 2 millions de dollars lors d'une levée de fonds pré-amorçage menée par Credo Ventures, avec la participation de Concept Ventures et d'autres investisseurs individuels.
Notre plateforme permet aux créateurs et éditeurs de narrer des contenus longs et de proposer leurs œuvres en format audio. Nos fonctionnalités reposent sur un modèle de deep learning développé en interne pour la synthèse vocale, capable de reproduire fidèlement l’intonation et les inflexions humaines, et d’adapter la narration selon le contexte. ElevenLabs propose aussi une gamme d’outils pour
Les avancées en capacité nécessitent de l'innovation, c'est pourquoi ElevenLabs se considère avant tout comme une entreprise de recherche. Une grande partie de cette recherche à ce jour s'est concentrée sur le développement de nouveaux modèles de text-to-speech qui reposent sur une haute compression et une compréhension du contexte pour rendre la parole humaine de manière ultra-réaliste. L'entreprise a également construit un nouveau modèle pour le Voice Cloning qui atteint une grande similarité de sortie sans entraînement (sans ajustement), sur des échantillons aussi courts que 5 secondes - un exploit inédit. Les développeurs peuvent accéder à toutes ces fonctionnalités via l'API.
Cette recherche alimente les fonctionnalités actuelles de la plateforme et contribue aussi à notre objectif ultime : convertir instantanément l’audio parlé d’une langue à une autre. Notre outil de doublage IA, prévu pour la fin de l’année, permettra de re-voicer automatiquement n’importe quel audio ou vidéo dans une autre langue, tout en conservant la voix originale de l’orateur. Nous visons d’abord les clients du secteur éducatif, avec pour ambition à long terme de rendre l’audio multilingue à la demande accessible partout : streaming,
Les outils de synthèse vocale et de doublage de l'entreprise sont aussi complémentaires qu'ils sont bien chronométrés : tous deux promettent d'apporter l'audio et la vidéo à un public plus large et arrivent à un moment où l'espace audio est en plein essor. Un groupe précoce de testeurs, parmi eux des créateurs YouTube, éditeurs et développeurs, utilise déjà la plateforme quotidiennement pour donner voix à des vidéos, histoires et personnages, et l'entreprise s'attend à ce que la sphère des applications potentielles pour la parole générative ne cesse de s'étendre. Les éditeurs de nouvelles ont déjà constaté que développer leur présence audio est un excellent moyen d'engager et de fidéliser les abonnés. Mais engager des doubleurs est coûteux, tout comme faire lire leurs histoires par des journalistes. Les auteurs de livres et de newsletters, et même les développeurs de jeux, font face à des défis similaires : les premiers se tournent de plus en plus vers la narration de leur propre travail et les seconds doivent décider si un personnage particulier justifie les coûts d'enregistrement. Ceux qui utilisent des logiciels de text-to-speech existants économisent de l'argent mais paient un prix différent en compromettant la qualité. ElevenLabs insiste sur le fait qu'il n'est plus nécessaire de faire des compromis alors qu'ils se préparent à équiper les créateurs et éditeurs des outils de narration IA les plus avancés et polyvalents.
« La plateforme que nous lançons maintenant consiste à transformer le texte en audio parlé de haute qualité. Nous voulons permettre aux gens de profiter de leur livre ou newsletter préféré en donnant une voix à tous les auteurs, créateurs et développeurs qui ne pouvaient pas s'en offrir une » - dit Mati Staniszewski, co-fondateur. « Notre objectif ultime est de permettre aux gens de profiter de tout contenu qu'ils trouvent pertinent et intéressant, quelle que soit la langue qu'ils parlent » - ajoute Piotr Dabkowski, également co-fondateur.
Chez Credo Ventures, nous cherchons à travailler avec des fondateurs intelligents et ambitieux de la région CEE. Nous avons vu la faim et l'étincelle dans les yeux de Mati et Piotr lors de notre toute première rencontre. Quelques mois plus tard, ils deviennent un centre de recherche en technologie vocale de niveau OpenAI surmontant les plus grands défis de l'audio artificiel. Leurs voix synthétisées sont déjà indiscernables des vraies et cette percée a non seulement considérablement abaissé les barrières à la génération de contenu d'une qualité et d'une fidélité sans précédent, mais bientôt elle permettra également aux créateurs d'élargir radicalement leur audience en devenant multilingue. – dit Maciek Gnutek, associé général chez Credo Ventures.
Bien que courante dans le divertissement et les affaires, l'audio a été relativement négligé par les récentes avancées en recherche. Nous ne pourrions pas être plus enthousiastes à l'idée de soutenir Mati et Piotr pendant cette ère dorée de l'IA générative, et nous croyons qu'ElevenLabs est l'équipe pour apporter cette technologie au grand public, une voix à la fois - dit Oliver Kicks, principal chez Concept Ventures.
À propos de ElevenLabs :
ElevenLabs est une entreprise de recherche qui développe des logiciels de synthèse vocale IA pour les créateurs et les éditeurs. Nos outils produisent une voix remarquablement naturelle et peuvent ajuster l’intonation et les inflexions selon le contexte ou les instructions de l’utilisateur. Notre plateforme vise à offrir la qualité et la polyvalence nécessaires pour devenir la référence pour la voix dans les actualités, newsletters, livres et vidéos. Les fonctionnalités clés incluent : génération vocale à partir de texte, clonage de voix,
Capital-risque fourni par Credo Ventures et Concept Ventures. Les investisseurs individuels incluent Peter Czaban, Tytus Cytowski, Talfan Evans, Dr Fatima Godall, Tomasz Karwatka, Piotr Karwatka, Akhil Paul, Bartek Pucek, Marta Pyrzyk, Carles Reina, Parin Shah, Charlie Songhurst et Harry Songhurst.
Contact
press@elevenlabs.io




