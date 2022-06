Algorithme : Une IA a appris à jouer à «Minecraft» sur YouTube

Un réseau de neurones artificiels de la société OpenAI a appris à jouer au célèbre jeu de construction et d’aventure comme un humain.

«Minecraft» a été lancé en 2011. AFP

Après son IA de génération de langage GPT-3 et de générations d’images réalistes DALL-E, OpenAI surprend encore. La société spécialisée dans la recherche en intelligence artificielle a dévoilé un nouvel algorithme qui a été capable d’apprendre à jouer à «Minecraft» après avoir visionné 70’000 heures de vidéos YouTube de personnes jouant au célèbre jeu de Mojang Studios.

Contrairement à d’autres algorithmes qui ont évolué dans des versions simplifiées de «Minecraft», celui d’OpenAI a joué dans le même environnement ouvert que celui accessible aux joueurs humains utilisant des commandes effectuées via une souris et un clavier. La méthode de Video PreTraining (VPT) a été complétée par un modèle baptisé IDM (Inverse Dynamics Model) qui consiste pour l’algorithme de déterminer quelle action a été effectuée. L’IA a ainsi appris à abattre des arbres pour collecter des bûches, à transformer ces bûches en planches, puis à transformer ces planches en une table. Le système a aussi appris à nager, à chasser des animaux et à manger la nourriture. L’IA a également assimilé la technique du «pillar jumping», qui consiste à s’élever de plus en plus haut dans le jeu en sautant et en plaçant à chaque fois un bloc sous son personnage.

«Nous avons choisi de valider notre méthode dans Minecraft parce que c’est l’un des jeux vidéo les plus joués du monde et qu’il dispose donc d’une grande quantité de données vidéo librement disponibles et c’est un jeu ouvert avec une grande variété de choses à faire, similaire aux applications du monde réel comme l’utilisation d’un ordinateur», a indiqué OpenAI.

Grâce à un entraînement plus poussé appelé «fine-tuning», l’IA a été ensuite capable d’effectuer les tâches apprises avec plus de précision, mais également de fabriquer des outils de bois et de pierre et des abris basiques, à explorer des villages et à chercher des coffres au trésor. Via la technique de l’apprentissage par renforcement, l’IA a également été en mesure de fabriquer une pioche en diamant, objet dont la création nécessite généralement 20 minutes et 24’000 actions aux joueurs humains.