Incontestablement dominé par AlphaGo depuis le début du tournoi, le grand maître de jeu de go Lee Sedol a créé la surprise en remportant la quatrième manche. Une victoire symbolique (puisque la série de cinq est déjà perdue pour lui) mais qui démontre les formidables ressources dont il a su faire preuve pour pousser l'intelligence artificielle à commettre des erreurs. Une défaite dont les créateurs d’AlphaGo se réjouissent car elle va leur permettre de rendre leur programme encore plus efficace.

au sommaire


    « Je n'ai jamais été autant félicité pour avoir gagné seulement une partie », a réagi avec humour Lee Sedol face à la salve d'applaudissements que lui a réservée la salle à l'issue du match. Le jeune joueur de go, considéré comme une véritable légende, a remporté le quatrième des cinq matchs qui l'opposent à AlphaGoAlphaGo, le programme d'intelligence artificielle (IAIA) conçu par DeepMind, une filiale de GoogleGoogle. Une victoire pour l'honneur puisque l'IA a déjà remporté trois victoires d'affilée. La domination d'AlphaGo semblait telle que l'exploit de Lee Sedol n'en est que plus impressionnant.

    La partie s'est déroulée en 180 coups, AlphaGo jouant avec noirs et Lee Sedol avec les blancs. Au 78e coup, le champion a placé une pierre dans le centre du plateau qui a pris par surprise l'IA mais aussi tous les spécialistes présents (voir le résumé de cette partie sur YouTube). AlphaGo a ensuite commis plusieurs erreurs qui l'ont conduit à abandonner la partie.

    Pour DeepMind, cette défaite est loin d'être un revers. Elle a au contraire beaucoup de valeur car elle va permettre d'affiner encore plus le fonctionnement du réseau neuronal qui sous-tend AlphaGo. « AlphaGo s'est entraîné en jouant contre lui-même. Ce qui veut dire qu'il peut y avoir des lacunes dans son savoir, mais nous ne sommes pas d'assez bons joueurs pour les déceler. C'est pour cela que nous sommes venus ici », a commenté David Silver, l'un des concepteurs d'AlphaGo qui s'est réjoui des enseignements qui vont être tirés de cette défaite.

    Interrogé sur les conséquences que pourraient avoir des erreurs commises par une IA dans le cadre d'un usage concret, par exemple médical, Demis Hassabis, le fondateur de DeepMind, a souligné qu'AlphaGo était encore un prototype. « Ce n'est pas une version bêta et même pas une version alpha. Par ailleurs, le programme n'a été conçu que pour jouer au go. Bien entendu, dans le cas d'un usage médical, il faudrait conduire d'autres types de tests. Mais les deux situations sont différentes. »

    La conférence de presse a permis d'apprendre qu'il existe deux versions d'AlphaGo. L'une fonctionne sur un seul ordinateur tandis que la seconde dite « distribuée » tourne sur plusieurs machines simultanément. C'est la seconde version, plus performante, qui affronte Lee Sedol.

    Lee Sedol (au centre) entouré de Sergei Brin, cofondateur de Google (à droite) et Demis Hassabis (à gauche). © Google

    Lee Sedol (au centre) entouré de Sergei Brin, cofondateur de Google (à droite) et Demis Hassabis (à gauche). © Google

    Lee Sedol a identifié deux faiblesses chez AlphaGo

    Une autre question intéressante concernait la manière dont AlphaGo concède une défaite. Comme l'affiche-t-il concrètement ? « AlphaGo détermine ses mouvementsmouvements en fonction des probabilités de victoire et il essaie de maximiser ces probabilités. S'il perçoit que le niveau de probabilité de succès est très bas, alors il abandonne » a répondu David Silver. Un message s'affiche sur l'écran et l'opérateur qui place les pierres sur le plateau effectue le mouvement de forfait.

    De nombreux observateurs se sont interrogés sur l'existence d'une « asymétrie » entre AlphaGo, qui possède des informations sur le jeu de Lee Sedol, et ce dernier qui ne sait rien du fonctionnement de l'IA. Cela peut-il donner un avantage à la machine ? Lee Sedol a estimé que cela n'était pas le vrai problème pour lui. « Je crois que le résultat final est attribuable aux insuffisances de mes capacités », a-t-il reconnu avec humilité.

    Cependant, le joueur dit avoir identifié deux faiblesses chez AlphaGo. La première est que le programme semble avoir plus de mal à jouer avec les noirs. La seconde est qu'un mouvement inattendu provoque ce qu'il qualifie de bugbug. « Il y avait des mouvements d'AlphaGo qui s'apparentaient à des bugs. Je pense que sa capacité de réponse s'est légèrement dégradée face à ces mouvements inattendus. »

    Demis Hassabis a pour sa part précisé qu'AlphaGo n'avait pas utilisé de parties jouées par Lee Sedol pour s'entraîner, assurant qu'il y avait une égalité entre les deux opposants du point de vue de l'information. « Nous avons utilisé des parties de joueurs amateurs de haut niveau piochées sur Internet », a-t-il expliqué, ajoutant qu'il fallait des millions de parties pour former l'intelligence artificielle et que quelques centaines ou milliers de parties ne suffisaient pas à la faire progresser.

    L'imprévisibilité serait-elle la meilleure arme de l'Homme face la machine ? Cela semble se vérifier dans le cas du go qui repose d'abord sur l'intuition. Le cinquième et dernier match qui aura lieu demain matin à partir de 4 heures s'annonce d'ores et déjà exaltant. Lee Sedol parviendra-t-il à trouver à nouveau une faille dans le jeu d'AlphaGo ? Tout semble beaucoup plus ouvert désormais.