Résumé :
- Introduction à l'IA générative et ses branches
- Termes généraux de l'IA générative
- Termes spécifiques à l'audio pour l'IA générative
- Termes spécifiques à la vidéo pour l'IA générative
- Autres applications spécifiques
- Questions fréquemment posées (FAQ)
Introduction à l'IA générative
Récemment, il semble que tout le monde parle de l'IA générative. Les grands modèles de langage et de texte-à-image comme ChatGPT, Stable Diffusion ou Midjourney ont fait beaucoup de bruit dans le monde de la tech, et au-delà. Beaucoup les considèrent parmi les développements les plus significatifs récents en IA. Que vous soyez d'accord ou non, le sentiment général semble être qu'une technologie très puissante est apparue.
De manière générale, l'IA générative désigne une classe de modèles d'apprentissage automatique capables de créer du nouveau contenu, qu'il s'agisse de texte, d'images, de musique ou de voix. Ce processus 'génératif' implique que le modèle apprend à partir de données existantes et utilise ensuite sa compréhension pour générer du nouveau contenu. Le type de contenu que ces modèles peuvent produire dépend des données sur lesquelles ils ont été entraînés.
Les bases de cette explosion des capacités de l'IA ont été posées lorsque le 'deep learning' est devenu populaire et que le mélange magique de vastes ensembles de données et d'ordinateurs puissants exécutant des réseaux neuronaux a considérablement amélioré la capacité des ordinateurs à reconnaître des images, traiter de l'audio et jouer à des jeux. À tel point que, vers la fin des années 2010, les ordinateurs pouvaient effectuer bon nombre de ces tâches mieux que n'importe quel humain.
Chez ElevenLabs, nous nous concentrons principalement sur l'aspect audio, mais l'IA générative a fait des avancées significatives dans divers domaines :
- Texte: Exemples incluent Chat-GPT, Bard.
- Image: Technologies notables sont Stable Diffusion, Midjourney, DALL-E.
- Voix : ElevenLabs