TechnologieL'IA crée des paysages à partir de simples croquis
La firme américaine Nvidia a dévoilé un système d'intelligence artificielle baptisé GauGAN capable de transformer des esquisses en images réalistes.
- par
- man
Son nom fait à la fois référence au peintre postrimpressionniste français du 19e siècle Paul Gaugain et aux réseaux antagonistes génératifs (GAN, Generative Adversarial Networks, en anglais) qu'il exploite. Le logiciel d'intelligence artificielle GauGAN, que l'équipe de recherche de la firme Nvidia a dévoilé lundi à la GPU Tech Conference à San Jose, en Californie, est capable de générer, à partir d'un dessin sommaire, des images réalistes de paysages n'ayant jamais existé, rapporte le site TechCrunch.
«C'est comme un livre de coloriage qui décrit où se situe un arbre, où se situe le soleil, où se situe le ciel», explique Bryan Catanzaro, vice-président de la recherche appliquée sur l'apprentissage profond chez Nvidia, en parlant de l'app qui ressemble à un logiciel . «Puis le réseau neuronal est capable de remplir tous les détails et les textures, les réflexions, les ombres et les couleurs, sur la base de ce qu'il (ndlr GauGAN) a appris à propos de vraies images.»
GauGAN a en effet été entraîné avec un million d'images hébergées sur le service de partage Flickr. Bryan Catanzaro précise que Nvidia n'a utilisé que des photos libres de droit. Le système a aussi intégré la compréhension des liens entre plus de 180 objets, comme la neige, les arbres, l'eau, les fleurs, ou encore les montagnes. De ce fait, il est par exemple en mesure de refléter un arbre sur la surface de l'eau si ces deux éléments sont proches ou de supprimer instantanément les feuilles de l'arbre si l'utilisateur décide d'ajouter de la neige au sol.
Cette démonstration n'est que la dernière en date des capacités des réseaux de neurones artificiels de la firme américaine. Des chercheurs de Nvidia ont récemment présenté une technologie capable de créer des visages factices de personnes n'ayant jamais existé, mais aussi un outil capable de générer un monde virtuel réaliste et interactif à partir de la vidéo d'un environnement réel.