Informatique: L'IA préfère apprendre que gagner dans «Mario Bros»

Publié

InformatiqueL'IA préfère apprendre que gagner dans «Mario Bros»

Un expert a programmé un agent censé découvrir par lui-même l'environnement du jeu culte de Nintendo

par
laf

Les algorithmes d'intelligence artificielle sont ordinairement entraînés pour obtenir des récompenses, améliorer le score dans le cas d'une partie de jeu vidéo. Partant du constat que le monde réel n'est pas rempli de récompenses, Deepak Pathak a choisi une autre approche. Il a apporté une composante de curiosité dans l'algorithme d'apprentissage de son agent, «pour voir si cela suffirait à le laisser apprendre une gamme de compétences». L'idée est de s'inspirer des humains, qui affichent «une curiosité innée qui les aide à apprendre», a expliqué le scientifique basé à l'Université de Californie à Berkeley.

L'intelligence artificielle de Deepak Pathak est motivée pour apprendre de nouvelles choses et non pas par le gain brut de récompenses. Les résultats ne sont pas encore à la hauteur des attentes. L'agent n'a exploré que 30% du premier tableau de la version originelle du jeu «Super Mario Bros». Il s'est refusé à aller plus loin, soit car il n'a pas compris qu'il fallait le faire, soit par une peur beaucoup plus humaine de faire mourir son personnage, avance le site New Scientist.

L'intelligence artificielle s'est montrée plus à son aise dans l'univers 3D du jeu de tir «Doom». Elle s'est baladée dans les couloirs en évitant soigneusement de se cogner contre les murs.

Ton opinion