Publié le: 31/05/2019 @ 19:41:51: Par Nic007 Dans "Jeux Vidéos"
Une équipe de programmeurs d'une société d'intelligence artificielle britannique a formé des « agents » autonomes à un jeu de tir à la première personne multijoueur, qui sont devenus si bons qu'ils ont battu des humains, une première. L'exploit a valu à l'équipe de DeepMind, filiale de la maison-mère de Google, Alphabet, une publication dans la très cotée revue Science jeudi. Jusqu'ici, les ordinateurs avaient battu les humains dans des jeux, mais en face-à -face, un contre un : Deep Blue a battu Garry Kasparov aux échecs en 1997, et AlphaGo de Google a battu le grand maître sud-coréen du jeu de go Lee Se-Dol en 2016.
Les programmeurs, menés par Max Jaderberg, ont utilisé une version modifiée de l'illustre jeu Quake III Arena, sorti pour la première fois en 1999 et qui reste populaire dans le monde de l'eSport. Le mode choisi était Capture the Flag. Les joueurs doivent saisir le drapeau de l'équipe adverse tout en protégeant le leur. Cela les oblige à attaquer et à défendre en même temps, ce qui requiert de la stratégie. Pour former leurs agents autonomes, les programmeurs ont eu recours à ce qui s'appelle l'apprentissage par renforcement. Les programmeurs leur ont seulement donné un objectif : capturer le drapeau. Les agents ont dû développer leur propre système de récompense interne pour chaque action nécessaire à l'obtention du résultat. Une autre innovation a consisté à entraîner plusieurs agents ensemble, et non séparément. Les chercheurs se sont rendu compte qu'ils progressaient beaucoup plus vite en groupe. L'équipe de DeepMind préfère ne pas faire de commentaire quand on l'interroge sur d'éventuelles utilisations militaires de ce type d'intelligence artificielle.
Les programmeurs, menés par Max Jaderberg, ont utilisé une version modifiée de l'illustre jeu Quake III Arena, sorti pour la première fois en 1999 et qui reste populaire dans le monde de l'eSport. Le mode choisi était Capture the Flag. Les joueurs doivent saisir le drapeau de l'équipe adverse tout en protégeant le leur. Cela les oblige à attaquer et à défendre en même temps, ce qui requiert de la stratégie. Pour former leurs agents autonomes, les programmeurs ont eu recours à ce qui s'appelle l'apprentissage par renforcement. Les programmeurs leur ont seulement donné un objectif : capturer le drapeau. Les agents ont dû développer leur propre système de récompense interne pour chaque action nécessaire à l'obtention du résultat. Une autre innovation a consisté à entraîner plusieurs agents ensemble, et non séparément. Les chercheurs se sont rendu compte qu'ils progressaient beaucoup plus vite en groupe. L'équipe de DeepMind préfère ne pas faire de commentaire quand on l'interroge sur d'éventuelles utilisations militaires de ce type d'intelligence artificielle.
Plus d'actualités dans cette catégorie