AlphaGo : Plus qu’un jeu, la naissance de la créativité algorithmique

 

En mars 2016, l’humanité n’a pas seulement assisté à la défaite d’un champion. Elle a été le témoin d’un acte de création pure, venu d’une intelligence non-humaine. L’histoire d’AlphaGo, l’IA de DeepMind (Google), et de son match historique contre le légendaire Lee Sedol, est celle d’un tournant majeur qui a redéfini les frontières de l’intelligence artificielle et ouvert des horizons scientifiques insoupçonnés.


 

Le Défi : Comment dompter un jeu plus vaste que l’univers ?

 

Avant de comprendre l’exploit, il faut mesurer l’obstacle. Le jeu de Go, avec ses règles d’une simplicité trompeuse, est un monstre de complexité combinatoire.

  • Une complexité abyssale : Le nombre de positions légales sur un plateau de Go (goban) est estimé à . À titre de comparaison, le nombre d’atomes dans l’univers observable est d’environ . Un ordinateur comme Deep Blue, qui a vaincu Garry Kasparov aux échecs en 1997, utilisait une méthode de « force brute » : il calculait des centaines de millions de coups à l’avance. Face à l’immensité du Go, cette approche revenait à vouloir vider l’océan avec une cuillère.

  • L’approche révolutionnaire de DeepMind : Conscient de cette impossibilité, le laboratoire DeepMind (racheté par Google) a adopté une stratégie radicalement différente, inspirée du cerveau humain. AlphaGo a été construit autour de deux « cerveaux » neuronaux :

    1. Le « Réseau de Politiques » (Policy Network) : Ce premier réseau apprend à imiter les joueurs humains experts. En analysant une base de données de 30 millions de coups issus de parties de haut niveau, il apprend à identifier une poignée de coups prometteurs parmi toutes les possibilités, réduisant ainsi drastiquement le champ de recherche.

    2. Le « Réseau de Valeur » (Value Network) : Ce second réseau évalue une position donnée sur le plateau et prédit le vainqueur probable. Il ne calcule pas tous les scénarios, mais développe une forme « d’intuition » pour juger de la force d’une configuration.

L’étape finale, et la plus cruciale, fut l’apprentissage par renforcement. AlphaGo a joué des millions de parties contre des clones de lui-même. À chaque partie, il affinait ses réseaux, corrigeait ses erreurs et découvrait de nouvelles stratégies, sans aucune intervention humaine. Il ne se contentait plus d’imiter les humains, il se dépassait lui-même.


 

Le « Coup 37 » : L’instant où l’IA a stupéfié le monde

 

Le décor est planté à Séoul, pour un match en cinq parties suivi par plus de 200 millions de personnes. Face à la machine se tient Lee Sedol, un maître dont le style de jeu est lui-même réputé pour sa créativité et son génie.

Alors que la deuxième partie bat son plein, AlphaGo, au 37ème coup, joue un coup qui plonge la salle dans un silence de stupeur. Il place sa pierre sur la « cinquième ligne », un coup considéré comme étrange et inefficace en début de partie par des siècles de sagesse humaine. La première réaction est unanime : c’est une erreur, un bug. Lee Sedol lui-même se lève et quitte la pièce pendant près de 15 minutes, visiblement choqué et déstabilisé.

Fan Hui, le champion d’Europe en titre et premier professionnel battu par AlphaGo quelques mois plus tôt, est aux commentaires. Sa réaction, capturée en direct, est devenue iconique :

« Ce n’est pas un coup humain. Je n’ai jamais vu un humain jouer ce coup. »

Pourtant, au fil des minutes, les experts qui analysent la partie réalisent lentement l’impensable. Le « Coup 37 » n’est pas une erreur. C’est un coup d’une profondeur stratégique inouïe, qui prépare le terrain pour une victoire écrasante 45 minutes plus tard. AlphaGo n’a pas seulement gagné ; il a joué un coup qu’aucun maître humain n’aurait envisagé. Il a révélé une nouvelle vérité sur un jeu vieux de 3000 ans. Il a fait preuve de créativité.


 

L’Héritage d’AlphaGo : De la stratégie de jeu à la révolution scientifique

 

Cette démonstration de « créativité algorithmique » a eu un impact bien au-delà des cercles de jeu. Elle a prouvé que l’approche de DeepMind pouvait être utilisée pour résoudre des problèmes complexes caractérisés par un nombre astronomique de possibilités.

Le successeur spirituel d’AlphaGo est AlphaFold. En appliquant des principes similaires d’apprentissage profond, DeepMind s’est attaqué à l’un des plus grands « défis sacrés » de la biologie depuis 50 ans : le problème du repliement des protéines. Prédire la structure tridimensionnelle complexe d’une protéine à partir de sa séquence d’acides aminés était un problème qui mobilisait des laboratoires entiers pendant des années.

AlphaFold l’a résolu avec une précision stupéfiante. Aujourd’hui, sa base de données, accessible à tous les scientifiques, contient des centaines de millions de structures protéiques prédites. Cette avancée a un impact direct et massif sur :

  • La conception de médicaments : Comprendre la forme d’une protéine est essentiel pour créer des molécules capables d’interagir avec elle.

  • La recherche sur les maladies : Des maladies comme Alzheimer, Parkinson ou la mucoviscidose sont liées à des protéines mal repliées.

  • Le développement de vaccins : La conception rapide de vaccins (notamment contre le SARS-CoV-2) repose sur la compréhension des protéines virales.

L’histoire d’AlphaGo nous enseigne que l’intelligence artificielle n’est pas seulement un outil d’automatisation. C’est un partenaire pour l’exploration, un amplificateur d’intelligence capable d’élargir notre propre champ de vision et de nous aider à résoudre les problèmes les plus fondamentaux auxquels l’humanité est confrontée.