Sophy, l’IA développée par Sony et Polyphony Digital, vient de confirmer ses qualités de pilote. Elle est parvenue à pulvériser le meilleur temps de Lewis Hamilton, septuple champion du monde de Formule 1.


au sommaire


    En février dernier, Sony AI et Polyphony DigitalDigital avaient présenté Sophy, une nouvelle intelligence artificielle pour les jeux de la série Gran Turismo. Elle devrait à terme remplacer l'IA actuelle, qui fonctionne grâce à des règles, que les joueurs trouvent trop prévisibles et dont le stylestyle de conduite diffère trop des humains.

    Le développement de Sophy se poursuit et vient de franchir une nouvelle étape en battant un des records de Lewis Hamilton. Les chercheurs l'ont mis à l'épreuve sur la Boucle Nord (Nordschleife) du Nürburgring à Nürburg. Longue de plus de 20 kilomètres, elle est considérée comme l'un des circuits les plus exigeants au monde. La course se passe dans le mode Lewis Hamilton Time Trial Challenge du jeu Gran Turismo Sport.

    La performance de l’IA Sophy dans le jeu GT Sport. © Sony IA

    Un temps atteint en prenant quelques raccourcis…

    Sony IA a publié une vidéo de l'exploit réalisé par Sophy. L'IA conduisait une Sauber Mercedes C9 '89 équipée de pneus Course : Durs (CrD). Elle a réussi à terminer un tour en seulement 5 minutes et 22,975 secondes, soit 17 secondes de moins que le score de Lewis Hamilton, qui est parvenu à faire un tour en 5 minutes et 40,622 secondes. L'IA a réussi cet exploit en prenant quelques libertés avec la piste, passant fréquemment sur l'herbe pour gagner quelques fractions de seconde. Néanmoins, elle a respecté les règles du jeu.

    Kazunori Yamauchi, créateur de la série Gran Turismo, a indiqué que l'objectif est que Sophy devienne « un professeur qui enseignera la conduite aux joueurs, un élève qui apprendra l'esprit sportif auprès des joueurs, et un ami avec qui faire la course ». Cette nouvelle IA devrait être disponible dans Gran Turismo 7 via une mise à jour future, mais aucune date n'a encore été annoncée.


    GT Sophy, l'IA qui domine les vrais pilotes sur Gran Turismo

    À quelques semaines de la sortie de Gran Turismo, Sony a dévoilé GT Sophy, une intelligence artificielle capable de battre les meilleurs joueurs en contre la montre, puis en course. Révolutionnaire au point d'avoir droit à la Une du magazine Nature, cette IA s'appuie sur l'apprentissage par renforcement.

    Article de Fabrice Auclert, publié le 10/02/2022

    Quel jeu va résister aux intelligences artificielles ? Après le go, les échecs ou encore Starcraft II, c'est désormais au tour des joueurs de Gran Turismo de s'incliner face à une IA. À quelques jours du lancement de la 7e édition de la célèbre simulation automobileautomobile de Polyphony Digital, Sony a dévoilé GT Sophy, une intelligence artificielle capable de battre les meilleurs pilotes !

    En juillet, cette IA avait d'abord battu les meilleurs humains dans des courses contre la montre, c'est-à-dire qu'elle était seule en piste. Mais, en octobre, un cap a été franchi puisque GT Sophy a battu des joueurs humains sur une véritable course avec donc des dépassements sur la piste, mais aussi de la stratégie. Justement, c'est dans ce domaine que l'IA impressionne.

    Valerio Gallo, l'un des meilleurs pilotes GT et champion de la Coupe des Nations des Championnats FIA GT 2021, a participé à un contre la montre contre Gran Turismo Sophy. © Sony 

    Une conduite inédite

    « L'IA roule d'une manière que nous n'aurions jamais imaginée », souligne ainsi Takuma Miyazono, une des références mondiales pour ce jeu vidéo. Même constat chez Kazunori Yamauchi, le créateur de Gran Turismo et directeur général du studio, Polyphony Digital, qui donne l'exemple du freinage en pleine courbe.

    « En règle générale, les pilotes de course apprennent à freiner en ligne droite avec pour objectif de ralentir dans la courbe pour accélérer à la sortie du virage. GT Sophy ne fait pas nécessairement cela. Lorsqu'elle entre dans une courbe, elle freine en fait lorsqu'elle s'engage dans la courbe. Habituellement, lorsque vous entrez dans une courbe, la charge est uniquement sur les deux pneus avant ; mais avec GT Sophy, vous avez la charge répartie sur trois pneus, deux à l'avant et un à l'arrière également. Cela permet à la voiture de freiner pendant qu'elle tourne. »

    Ce qui distingue cette IA des autres, c'est son type d'apprentissage. On connaissait ainsi l'apprentissage « profond », et il fait déjà partie de notre quotidien aujourd'hui dans les recherches sur Internet ou la lutte contre le spam. L'IA est entraîné avec des millions d'exemples, et elle est ensuite capable d'être autonome pour trouver des images similaires ou éliminer le spam dans nos e-mails. GT Sophy y a eu droit avec plus de 45.000 heures d'apprentissage, basées sur des années de jeux et stockées sur un millier de PlayStation !

    Mille PS4 ont été utilisées pour former GT Sophy. © Sony
    Mille PS4 ont été utilisées pour former GT Sophy. © Sony

    La puissance de l'apprentissage par renforcement

    Pour compléter ce machine learning qui est très brut, Sony a opté pour l'apprentissage par renforcement (reinforcement learning). C'est un type d'apprentissage automatique utilisé pour former des IA à prendre des décisions dans un environnement avec un système de récompenses ou de pénalités pour chaque action en fonction des résultats auxquels elles conduisent. Cette méthode appliquée à la simulation sportive est si pertinente et pointue qu'elle a droit cette semaine à un article et même la couverture du prestigieux magazine Nature.

    Le schéma ci-dessous montre comment une IA interagit avec son environnement. Elle entreprend une action dans le monde, reçoit une récompense (ou une pénalité) et une description mise à jour de l'état du monde pour déterminer sa prochaine action. Appliqué à la course automobile, il s'agit de réagir aux manœuvres des adversaires, mais aussi aux modifications de la piste. La difficulté était de prendre conscience des règles non écrites de la course automobile, comme éviter les collisions et ne pas couper les virages de manière dangereuse.

    Pour défier GT Sophy, il faudra hélas patienter puisqu'elle ne sera pas incluse dans Gran Turismo 7, mais via une mise à jour ultérieure. Selon les pilotes chevronnés qui l'ont testée, son point fort tient dans sa capacité à avoir une conduite « humaine ». À aucun moment, ils n'ont eu le sentiment de défier un ordinateurordinateur dont le pilotage est habituellement très mécanique et prévisible.

    À chaque freinage ou accélération, l'IA modifie son environnement, et l’apprentissage par renforcement lui permet d'apprendre de ses propres erreurs pour ne pas les répéter. © Sony
    À chaque freinage ou accélération, l'IA modifie son environnement, et l’apprentissage par renforcement lui permet d'apprendre de ses propres erreurs pour ne pas les répéter. © Sony