
Cette Voix n'Existe Pas - Voix IA Générative
Nous déployons notre propre modèle génératif qui permet aux utilisateurs de créer des voix synthétiques entièrement nouvelles
Récemment, il semble que tout le monde parle de l'IA générative. Des modèles de langage et de texte-à-image alimentés par l'apprentissage profond comme ChatGPT, Stable Diffusion, DALL-E et Midjourney ont fait beaucoup de bruit dans le monde de la tech, et au-delà. Beaucoup les considèrent parmi les développements récents les plus significatifs en IA. Que vous soyez d'accord ou non, le sentiment général semble être que quelque chose de très puissant est apparu. En 2023, nous entendrons parler de modèles qui peuvent vous aider à dessiner ou créer des vidéos. Tout comme les questions sur le dernier smartphone à la mode, nous demanderons bientôt quel est le dernier modèle de base à la mode. Pourtant, malgré tout cet enthousiasme, nous pensons qu'il y a un domaine dans les médias génératifs qui est encore sévèrement sous-estimé : la voix IA. C'est aussi le domaine dans lequel nous cherchons à devenir leaders. Chez Eleven, nous comptons chaque jour sur le potentiel débloqué par les techniques d'apprentissage profond pour alimenter notre text-to-speech et nos outils de voice cloning. Et maintenant, nous déployons également notre propre modèle génératif qui vous permet de créer des voix synthétiques entièrement nouvelles à partir de zéro.
Générateur de Voix - concevez une voix
Nos utilisateurs se rendent quotidiennement sur la plateforme pour donner vie à leurs personnages - que ce soit pour des livres audio, des jeux ou de la fan fiction. Nous avons réalisé que notre banque de locuteurs actuelle est trop petite pour que chacun trouve les voix qui correspondent à ses besoins tout en restant exclusives à chaque utilisateur. Notre solution a été de vous laisser concevoir des voix synthétiques entièrement nouvelles.
Nous avons eu une idée de la façon dont nous procéderions en déballant les méthodes que nous utilisons actuellement pour la synthèse vocale et le voice cloning. Les deux processus nécessitent un moyen d'encoder les caractéristiques d'une voix particulière. Les embeddings de locuteurs portent cette identité - ce sont une représentation vectorielle de la voix d'un locuteur. Nous avons réalisé que nous pouvions échantillonner à partir de la distribution des embeddings de locuteurs en entraînant un modèle dédié pour nous permettre de créer une infinité de nouvelles voix.
Puisque nos utilisateurs recherchent principalement des caractéristiques vocales spécifiques, nous devions ajouter un degré de contrôle sur le processus. Nous avons élargi notre modèle avec un conditionnement pour générer des voix basées sur leurs caractéristiques. Le modèle vous permet maintenant de définir certains paramètres de base qui établissent l'identité centrale de la nouvelle voix : genre, âge, accent, hauteur et style de parole. En d'autres termes, chaque fois que vous appuyez sur 'générer', même si vous choisissez les mêmes paramètres de base, vous obtenez une voix complètement nouvelle qui n'existait pas auparavant.
Voici quelques exemples de voix qui peuvent être conçues de cette manière :
'Design Voice' sera disponible sur notre plateforme en février, dans le cadre de Voice Lab.
À quoi ça sert ?
Nos outils peuvent déjà produire une parole aussi réaliste que celle de n'importe quel humain et nous nous attendons à ce que le champ des applications potentielles pour les voix artificielles ne cesse de s'élargir. Beaucoup de ces nouvelles applications, y compris l'enregistrement audio pour les publications de presse ou les publicités, nécessiteront qu'une voix soit confinée à, et identifiée avec, une marque ou un cas d'utilisation particulier, et ne soit pas utilisée ailleurs. D'autres cas d'utilisation, comme la narration et les jeux vidéo, privilégient la flexibilité et la liberté d'expérimenter dès le début du développement. Plutôt que de créer un ensemble gigantesque de locuteurs virtuels, nous avons décidé de laisser les utilisateurs avoir le dernier mot sur les voix qui conviennent le mieux à leurs objectifs.
Les auteurs de livres
Les éditeurs de nouvelles
Les développeurs de jeux vidéo
Les créatifs en publicité
Des créateurs produisant toutes sortes de contenus audio et vidéo aux responsables d'entreprise cherchant à donner une voix aux communications de l'entreprise, les opportunités de concevoir un audio convaincant qui soit à la fois unique et adapté à un cas d'utilisation spécifique sont désormais infinies.
IA Éthique
De même que le voice cloning suscite des craintes quant aux conséquences de son utilisation potentielle abusive, de plus en plus de personnes s'inquiètent que la prolifération de la technologie IA mette en péril les moyens de subsistance des professionnels. Chez Eleven, nous voyons un avenir où les doubleurs pourront licencier leurs voix pour entraîner des modèles de parole pour un usage spécifique, en échange de frais. Les clients et les studios continueront à mettre en avant des talents vocaux professionnels dans leurs projets et l'utilisation de l'IA contribuera simplement à des délais d'exécution plus rapides et à une plus grande liberté d'expérimentation et d'établissement de la direction dès le début du développement. La technologie changera la façon dont l'audio parlé est conçu et enregistré mais le fait que les doubleurs n'aient plus besoin d'être physiquement présents pour chaque session leur donne vraiment la liberté de participer à plus de projets en même temps, ainsi que d'immortaliser véritablement leurs voix.
En plus de cela, la raison pour laquelle nous sommes enthousiastes est qu'une multitude de livres, de nouvelles, de jeux indépendants et d'autres contenus dont les auteurs et développeurs ne pourraient autrement pas se permettre les coûts d'enregistrement deviendront désormais accessibles par un autre moyen. Avec cet accès accru vient l'opportunité d'élargir les audiences dans chaque cas.
Chez Eleven, nous nous engageons pleinement à respecter les droits de propriété intellectuelle et à mettre en œuvre des mesures de protection contre l'utilisation abusive potentielle de notre technologie :
- Nous ne collaborons qu'avec des clients qui adhèrent à nos Conditions interdisant l'utilisation malveillante de notre technologie à des fins pouvant être considérées comme illégales ou nuisibles ;
- Nous travaillons également sur le filigrane de tout audio généré par notre modèle afin qu'il puisse être instantanément retracé jusqu'à nous ;
- Lorsque nous utilisons des voix reconnaissables, nous le faisons à des fins de démonstration et dans des contextes qui ne donnent pas lieu à des conflits d'intérêts ;
- En même temps, nous cherchons à soutenir les propriétaires de voix et leurs licenciés dans la revendication de leurs droits et toutes les infractions connues seront examinées et traitées.
Regard vers l'avenir - améliorez votre propre voix
À l'avenir, nous prévoyons de combiner les capacités de nos modèles de génération de voix et de voice cloning pour permettre aux utilisateurs d'améliorer leurs propres voix. Vous pourrez cloner votre voix puis la manipuler pour obtenir l'effet désiré. Si vous craignez que votre style de parole naturel soit un peu monotone, vous pourrez y ajouter de la variété. Si vous n'aimez vraiment pas être enregistré, vous pourrez manipuler le rendu pour qu'il sonne plus naturel. Toute personne ayant besoin de produire de l'audio avec sa propre voix pour n'importe quel but, que ce soit une présentation préenregistrée ou un message audio, pourra le faire en utilisant notre suite d'outils, en un clic.
Bonne Année
Alors que 2022 touchait à sa fin, nous tenons à remercier nos bêta-utilisateurs pour votre participation continue et vos retours. Beaucoup des fonctionnalités que nous développons sont dues à vos contributions et suggestions. Nous ne pourrions être plus heureux de vous avoir à bord et nous vous souhaitons à tous une Bonne Année.
Eleven Labs Beta
Allez ici pour vous inscrire à notre plateforme bêta et l'essayer par vous-même. Nous apportons constamment des améliorations et tous les retours des utilisateurs sont très précieux pour nous à ce stade précoce.
Découvrez les articles de l'équipe ElevenLabs


We’re partnering with Liberty Global to accelerate voice AI expansion across Europe
Their strategic investment supports the next stage of our growth in the region
