MuZero

MuZero est un programme informatique développé par DeepMind (une entreprise britannique spécialisée dans l'intelligence artificielle) dont l'objectif est de maîtriser des jeux variés (jeux de société, jeux vidéos, etc.) sans en connaître les règles^[1]^,^[2]^,^[3]. Il a été rendu public en 2019, avec des données précises sur ses résultats aux échecs, au shōgi, au go, ainsi que sur un ensemble standardisé de jeux sur Atari ; ses performances dans chacun de ces jeux étaient égales ou supérieures à celles des meilleurs programmes spécialisés existant. L'algorithme utilise une approche analogue à celle de AlphaZero, mais il démarre sans aucune connaissance des règles, en ayant simplement l'information selon laquelle un mouvement qu'il tente est ou non permis, et quelles en sont les conséquences^[4].

↑ (en) Kyle Wiggers, « DeepMind's MuZero teaches itself how to win at Atari, chess, shogi, and Go », VentureBeat (consulté le 22 juillet 2020)
↑ Frederic Friedel, « MuZero figures out chess, rules and all », ChessBase GmbH,‎ décembre 2019 (lire en ligne, consulté le 22 juillet 2020)
↑ (en) Jesus Rodriguez, « DeepMind Unveils MuZero, a New Agent that Mastered Chess, Shogi, Atari and Go Without Knowing the Rules », sur KDnuggets, décembre 2019 (consulté le 22 juillet 2020)
↑ (en) Julian Schrittwieser, Ioannis Antonoglou, Thomas Hubert, Karen Simonyan, Laurent Sifre, Simon Schmitt, Arthur Guez, Edward Lockhart, Demis Hassabis, Thore Graepel et Timothy Lillicrap, « Mastering Atari, Go, chess and shogi by planning with a learned model », Nature, vol. 588, n^o 7839,‎ 2020, p. 604–609 (PMID 33361790, DOI 10.1038/s41586-020-03051-4, Bibcode 2020Natur.588..604S, arXiv 1911.08265, S2CID 208158225)

[1] (en) Kyle Wiggers, « DeepMind's MuZero teaches itself how to win at Atari, chess, shogi, and Go », VentureBeat (consulté le 22 juillet 2020)

[2] Frederic Friedel, « MuZero figures out chess, rules and all », ChessBase GmbH,‎ décembre 2019 (lire en ligne, consulté le 22 juillet 2020)

[3] (en) Jesus Rodriguez, « DeepMind Unveils MuZero, a New Agent that Mastered Chess, Shogi, Atari and Go Without Knowing the Rules », sur KDnuggets, décembre 2019 (consulté le 22 juillet 2020)

[4] (en) Julian Schrittwieser, Ioannis Antonoglou, Thomas Hubert, Karen Simonyan, Laurent Sifre, Simon Schmitt, Arthur Guez, Edward Lockhart, Demis Hassabis, Thore Graepel et Timothy Lillicrap, « Mastering Atari, Go, chess and shogi by planning with a learned model », Nature, vol. 588, n^o 7839,‎ 2020, p. 604–609 (PMID 33361790, DOI 10.1038/s41586-020-03051-4, Bibcode 2020Natur.588..604S, arXiv 1911.08265, S2CID 208158225)

[1]

[2]

[3]

[4]