
Eleven v3 Audio Tags: Precision delivery control for AI speech
Fine-grained control over timing, rhythm, and emphasis with Eleven v3 Audio Tags. Transform flat delivery into dynamic, performative content.
Présentation de Eleven v3 Alpha
Essayez v3ElevenLabs, entreprise de recherche en technologie vocale et leader mondial des logiciels audio IA, a levé 19 millions de dollars en série A pour poursuivre ses recherches en voix IA et le déploiement de ses produits - dans le cadre de sa mission de rendre tout contenu universellement accessible
2023-06-20, Londres / New York - ElevenLabs, une entreprise de recherche en technologie vocale et leader mondial des logiciels audio IA, a levé 19 millions de dollars en série A pour poursuivre sa recherche en voix IA et le déploiement de produits - dans le cadre de sa mission de rendre tout contenu universellement accessible.
ElevenLabs a dévoilé sa plateforme bêta en janvier 2023, après avoir passé 2022 à développer des modèles audio IA capables de créer les voix IA les plus polyvalentes et contextuellement conscientes. Depuis son lancement, ElevenLabs a accumulé plus d'un million d'utilisateurs inscrits qui ont généré plus de 10 ans de contenu audio.
Les outils ElevenLabs peuvent transformer n'importe quel texte en discours en utilisant des voix synthétiques, des voix clonées ou en créant des voix artificielles entièrement nouvelles qui peuvent être adaptées selon les préférences de genre, d'âge et d'accent. Grâce à sa recherche, ElevenLabs a pu atteindre un nouveau niveau de qualité vocale presque indiscernable d'une voix humaine réelle avec une latence inférieure à une seconde.
Leur plateforme a déjà été adoptée dans de nombreux secteurs créatifs, des auteurs indépendants créant des livres audio, aux développeurs donnant voix aux personnages de jeux vidéo, en aidant les malvoyants à accéder au contenu écrit en ligne, et en alimentant la première chaîne de radio IA au monde. ElevenLabs a également lancé une gamme de partenariats B2B, y compris avec l'un des plus grands éditeurs de livres audio au monde Storytel, la plateforme de création de contenu mondial TheSoul Publishing, des développeurs de jeux incroyables comme Embark Studios et Paradox Interactive, et la plateforme de médias créatifs MNTN.
ElevenLabs annonce aujourd'hui avoir levé un tour de table de 19 millions de dollars en série A co-dirigé par Nat Friedman, Daniel Gross, et Andreessen Horowitz, avec la participation supplémentaire de Credo Ventures, Concept Ventures, et une série d'investisseurs stratégiques, y compris le co-fondateur d'Instagram Mike Krieger, le co-fondateur d'Oculus VR Brendan Iribe, le co-fondateur d'Ubiquity6 Anjney Midha, le co-fondateur de Deepmind & Inflection Mustafa Suleyman, le co-fondateur de Runway Siqi Chen, le co-fondateur d'Inkitt Ali Albazaz, le co-fondateur de Reface Dima Shvets, le co-fondateur de Perplexity AI Aravind Srinivas, le fondateur de Vercel Guillermo Rauch, le fondateur d'O’Reilly Media Tim O’Reilly, Creator Ventures et SV Angel. Embark Studios, Storytel et TheSoul Publishing rejoignent également ce tour en tant qu'investisseurs. Andreessen Horowitz prend un siège au conseil d'administration.
Cet investissement sera utilisé pour continuer à construire le centre de recherche de pointe d'ElevenLabs pour la voix IA et pour lancer une gamme de produits supplémentaires pour soutenir des secteurs de marché spécifiques tels que l'édition, le jeu, le divertissement et les applications conversationnelles.
Mati Staniszewski, PDG et co-fondateur d'ElevenLabs, commente :
« Au cours des cinq derniers mois, nous avons vu notre technologie adoptée par des millions de créateurs, d'entreprises et d'esprits curieux. Nous sommes au tout début de ce voyage et maintenant avec Nat, Daniel et Andreessen Horowitz à nos côtés, nous avons les meilleurs partenaires pour continuer sur cette voie ambitieuse. »
Piotr Dabkowski, CTO et co-fondateur d'ElevenLabs, ajoute :
« Depuis notre création en avril 2022, nous nous sommes concentrés sur la constitution d'une grande équipe - l'un des facteurs clés pour un succès à long terme - et avons construit une équipe unique de personnes talentueuses, passionnées et travailleuses. Avec un ensemble aussi formidable de collègues et de partenaires, nous sommes bien partis pour réaliser notre ambition de briser complètement les barrières linguistiques grâce à la technologie. »
L'entreprise adopte une approche intégrée pour développer la recherche et les produits en voix IA. En réponse à la demande des utilisateurs, ElevenLabs annonce également Studio - un flux de production très recherché pour éditer et créer du contenu parlé dynamique et de longue durée.
Studio offrira aux créateurs de contenu, tels que les éditeurs et les auteurs indépendants, un niveau de contrôle jusqu'ici inaccessible sur leur contenu audio généré par IA. Il s'appuie sur la recherche de l'entreprise en synthèse vocale de longue durée et en 'remplissage' audio pour fournir aux utilisateurs la capacité de générer de manière fluide des segments de dialogue entiers, des articles de presse et même des livres audio sans quitter la plateforme. Studio vise à offrir un niveau de simplicité et de convivialité 'Google Docs' à la création audio.
Studio rejoint la suite de produits ElevenLabs, qui comprend Speech Synthesis, une plateforme text-to-speech qui exploite des voix synthétiques préexistantes et VoiceLab, un flux de travail pour créer une voix unique ou une version numérique d'une voix existante. La plateforme a également récemment ouvert l'accès à Eleven Multilingual - un modèle de synthèse vocale, qui peut être utilisé dans les principales langues européennes. La plateforme est disponible pour tous à : elevenlabs.io.
Ces récents développements de produits sont des étapes vers le développement d'un outil de doublage IA prévu pour être lancé plus tard cette année. Cela permettra de doubler n'importe quelle vidéo dans n'importe quelle langue de manière engageante, efficace et évolutive, tout en conservant la voix originale du locuteur. L'entreprise mène déjà plusieurs tests avec des partenaires de l'industrie pour permettre le doublage IA à grande échelle.
ElevenLabs dévoile également son AI Speech Classifier. Cet outil permettra à quiconque de télécharger un échantillon audio et de découvrir si le clip contient de l'audio généré par IA d'ElevenLabs. Ce produit est le premier du genre dans le domaine de l'audio génératif. Il est maintenant disponible pour le public et pour des partenaires sélectionnés sous forme d'API. La sortie de l'AI Speech Classifier est la dernière étape dans la démarche de l'entreprise pour la transparence, et c'est une pierre angulaire de leur engagement à créer un paysage médiatique génératif sûr.
Mati Staniszewski ajoute :
"Notre mission est d'être l'outil ultime pour raconter des histoires, en dissolvant les barrières linguistiques et en mettant tous les publics à la portée de tous les créateurs de contenu de manière sûre et responsable. Avec une équipe incroyable et en pleine croissance et ces investisseurs exceptionnels, ElevenLabs est maintenant plus proche que jamais de réaliser son objectif à long terme de rendre tout contenu universellement accessible dans n'importe quelle langue et avec n'importe quelle voix. »
À propos d'ElevenLabs :
Établie en 2022, ElevenLabs est une entreprise de recherche en technologie vocale développant des logiciels de text-to-speech de premier plan pour les éditeurs et les créateurs. Notre mission est de rendre le contenu universellement accessible.
L'entreprise a été fondée par des amis d'enfance Mati Staniszewski et Piotr Dabkowski. Inspirés par les mauvais doublages des films américains qu'ils regardaient en grandissant dans leur Pologne natale, ils ont entrepris de concevoir une plateforme capable d'éliminer les barrières linguistiques du contenu. ElevenLabs est incorporée aux États-Unis et a une présence mondiale à distance.
Contact
press@elevenlabs.io
Fine-grained control over timing, rhythm, and emphasis with Eleven v3 Audio Tags. Transform flat delivery into dynamic, performative content.
Create dynamic multi-character dialogue with Eleven v3 Audio Tags. Script overlapping voices, interruptions, and emotional shifts for natural, human-like AI conversations.