Alphazero

Alpha Zéro de la société DeepMind-Google révolutionne la programmation du jeu d'échecs

Certains programmeurs restaient assez septique sur la réussite de l'adaptation de la méthode de
l'apprentissage profond ( deep learning ), aussi appelé algorithme d'apprentissage de renforcement général,
au jeu d'échecs comme pour Alphago au jeu de go.
Apparemment, la réussite est pourtant totale en observant les résultats obtenus
face à l'un des meilleurs programmes de jeu nommé Stockfish.

En effet, selon DeepMind, après 9 heures d'entraînement face à lui-même et 44 millions de parties
Alpha Zéro, avec son algorithme d'apprentissage de renforcement général,
a assimilé le jeu d'échecs. Il a ensuite rencontré le programme Stockfish version 2016
dans un match de 1.300 parties avec un temps de réflexion d'une minute par coup.
Le résultat laisse incrédule beaucoup de connaisseurs...et semble presque irréel.

victoires Alpha zéro nulles victoires Stockfish
318 958 24