Alpha Zéro de la société DeepMind-Google révolutionne la programmation du jeu d'échecs

Certains programmeurs restaient assez septique sur la réussite de l'adaptation de la méthode de 
l'apprentissage profond ( deep learning ), aussi appelé algorithme d'apprentissage de renforcement général, 
au jeu d'échecs comme pour Alphago au jeu de go.
Apparemment, la réussite est pourtant totale en observant les résultats obtenus 
face à l'un des meilleurs programmes de jeu nommé Stockfish.

En effet, selon DeepMind, après 9 heures d'entraînement face à lui-même et 44 millions de parties 
Alpha Zéro, avec son algorithme d'apprentissage de renforcement général, 
a assimilé le jeu d'échecs. Il a ensuite rencontré le programme Stockfish version 2016 
dans un match de 1.300 parties avec un temps de réflexion d'une minute par coup. 
Le résultat laisse incrédule beaucoup de connaisseurs...et semble presque irréel.

victoires Alpha zéro                                         nulles                                      victoires Stockfish
318                                                       958                                                   24

 

Cela reste a confirmer, DeepMind a transmis 10 parties que vous pouvez étudier. ( voir ci-dessous )

Pour en savoir plus : 

         




   
Leela Zero, comme son grand frère Alphazero,
progresse en apprenant de ses erreurs.

Le but est de construire un moteur d'échecs
  en suivant les mêmes techniques qu'AlphaZero,
 comme décrit dans Mastering Chess et Shogi par Self-Play
avec un algorithme d'apprentissage de renforcement général.

Pour faire face à l'énorme quantité de calculs,
le projet est ouvert et partagé aux internautes intéressés.


 LCZero 280  cote 2450