L’homme bat la machine au Go dans la victoire humaine sur l’IA

Utilisateur Flickr LNG0004

Un joueur humain a complètement vaincu un système d’IA de premier plan au jeu de société Go, dans un renversement surprise de la victoire informatique de 2016 qui a été considérée comme une étape importante dans l’essor de l’intelligence artificielle.

Kellin Pelrine, une joueuse américaine qui se situe un niveau en dessous du meilleur classement amateur, a battu la machine en profitant d’une faille jusqu’alors inconnue qui avait été identifiée par un autre ordinateur. Mais la confrontation en tête-à-tête dans laquelle il a remporté 14 des 15 matchs a été entreprise sans support informatique direct.

Le triomphe, qui n’a pas été signalé auparavant, a mis en évidence une faiblesse dans les meilleurs programmes informatiques Go qui est partagée par la plupart des systèmes d’IA largement utilisés aujourd’hui, y compris le chatbot ChatGPT créé par OpenAI, basé à San Francisco.

La tactique qui a remis un humain au sommet du tableau de Go a été suggérée par un programme informatique qui avait sondé les systèmes d’IA à la recherche de faiblesses. Le plan suggéré a ensuite été impitoyablement livré par Pelrine.

“Il nous a été étonnamment facile d’exploiter ce système”, a déclaré Adam Gleave, directeur général de FAR AI, la société de recherche californienne qui a conçu le programme. Le logiciel a joué plus d’un million de parties contre KataGo, l’un des meilleurs systèmes de Go, pour trouver un “angle mort” dont un joueur humain pourrait profiter, a-t-il ajouté.

La stratégie gagnante révélée par le logiciel “n’est pas complètement triviale mais ce n’est pas super difficile” à apprendre pour un humain et pourrait être utilisée par un joueur de niveau intermédiaire pour battre les machines, a déclaré Pelrine. Il a également utilisé la méthode pour gagner contre un autre système de Go de premier plan, Leela Zero.

La victoire décisive, bien qu’avec l’aide de tactiques suggérées par un ordinateur, survient sept ans après que l’IA semble avoir pris une avance inattaquable sur les humains dans ce qui est souvent considéré comme le plus complexe de tous les jeux de société.

Publicité

AlphaGo, un système conçu par la société de recherche appartenant à Google DeepMind, a battu le champion du monde de Go Lee Sedol par quatre matchs contre un en 2016. Sedol a attribué sa retraite de Go trois ans plus tard à la montée de l’IA, affirmant que c’était “une entité qui ne peut être vaincu ». AlphaGo n’est pas accessible au public, mais les systèmes contre lesquels Pelrine a prévalu sont considérés sur un pied d’égalité.

Dans une partie de Go, deux joueurs placent alternativement des pierres noires et blanches sur un plateau délimité par une grille 19×19, cherchant à encercler les pierres de leur adversaire et à enserrer le plus d’espace possible. Le grand nombre de combinaisons signifie qu’il est impossible pour un ordinateur d’évaluer tous les futurs mouvements potentiels.

La tactique utilisée par Pelrine impliquait d’enchaîner lentement une grande “boucle” de pierres pour encercler l’un des propres groupes de son adversaire, tout en distrayant l’IA avec des mouvements dans d’autres coins du plateau. Le bot Go-playing n’a pas remarqué sa vulnérabilité, même lorsque l’encerclement était presque complet, a déclaré Pelrine.

“En tant qu’humain, ce serait assez facile à repérer”, a-t-il ajouté.

La découverte d’une faiblesse dans certaines des machines de Go les plus avancées indique une faille fondamentale dans les systèmes d’apprentissage en profondeur qui sous-tendent l’IA la plus avancée d’aujourd’hui, a déclaré Stuart Russell, professeur d’informatique à l’Université de Californie à Berkeley.

Les systèmes ne peuvent “comprendre” que des situations spécifiques auxquelles ils ont été exposés dans le passé et sont incapables de généraliser d’une manière que les humains trouvent facile, a-t-il ajouté.

“Cela montre une fois de plus que nous avons été beaucoup trop hâtifs pour attribuer des niveaux d’intelligence surhumains aux machines”, a déclaré Russell.

La cause précise de l’échec des systèmes Go-playing est une question de conjecture, selon les chercheurs. Une raison probable est que la tactique exploitée par Pelrine est rarement utilisée, ce qui signifie que les systèmes d’IA n’ont pas été entraînés sur suffisamment de jeux similaires pour se rendre compte qu’ils étaient vulnérables, a déclaré Gleave.

Il est courant de trouver des failles dans les systèmes d’IA lorsqu’ils sont exposés au type d ‘«attaque contradictoire» utilisée contre les ordinateurs jouant au Go, a-t-il ajouté. Malgré cela, « nous voyons très grand [AI] systèmes déployés à grande échelle avec peu de vérification ».

Copyright The Financial Times Limited 2023 © 2023 The Financial Times Ltd. Tous droits réservés. Veuillez ne pas copier et coller les articles de FT et les redistribuer par e-mail ou par la poste sur le Web.

commentaires

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Le plus populaire