DeepMind vient de présenter sa nouvelle intelligence artificielle Gato. Plutôt que d’être spécialisée dans une tâche précise, elle est au contraire capable d’effectuer plus de 600 tâches, et peut même battre des experts.


au sommaire


    L'Intelligence artificielle forte, aussi appelée Intelligence artificielle généralisée (AGI), est le graal des chercheurs en IA. Elle serait capable de rivaliser avec l'intelligence humaine, voire même serait consciente. DeepMind, société sœur de GoogleGoogle, vient de publier un article sur Gato, une nouvelle IA généraliste qui pourrait être le précurseur de l'IA forte.

    La majorité des IA actuelles sont spécialisées dans une tâche, entraînées avec des réseaux neuronaux dans un but spécifique comme celui de créer des deepfakes ou de jouer aux échecs. Avec Gato, DeepMind prend l'approche inverse et a créé une seule IA capable d'effectuer de nombreuses tâches très différentes.

    Selon les auteurs, « le même réseau avec les mêmes poids est capable de jouer à la console Atari, identifier le contenu des images, discuter, empiler des blocs avec un vrai bras robotique et bien plus ». L'IA utilise le contexte pour décider sous quelle forme donner ses réponses. Au total, elle est capable d'effectuer 604 tâches avec un seul et même modèle, un véritable exploit.

    Représentation de l’architecture de Gato. © DeepMind
    Représentation de l’architecture de Gato. © DeepMind

    Une IA qui bat les experts, mais pas tout le temps

    DeepMind a utilisé un réseau neuronalréseau neuronal de type transformeur, généralement utilisé dans le traitement des langues. Gato a été entraîné sur un grand nombre de bases de donnéesbases de données, contenant des images, du texte, ainsi que l'expérience d'agents dans le monde réel ou dans des environnements simulés.

    Le problème est que l'IA ne parvient pas à réaliser ces tâches correctement tout le temps. Par exemple, les réponses lors d'une discussion peuvent être incorrectes. Gato a notamment indiqué que Marseille était la capitale de la France... DeepMind indique que, pour les trois quarts des tâches (450 sur 604), l'IA aurait de meilleures performances qu'un expert la moitié du temps. On serait donc sur un taux de succès à un peu plus d'un tiers.

    Le modèle généraliste évoluera avec les progrès techniques

    Toutefois, il existe une bonne raison pour laquelle DeepMind travaille sur un système généraliste capable d'effectuer une telle variété de tâches. Ce choix fait suite aux conclusions de plusieurs spécialistes du domaine. Rich Sutton, un des fondateurs de l'apprentissage par renforcement, a déclaré que les méthodes de calcul généralistes sont plus efficaces, et de loin. Selon lui, la plupart des chercheurs se basent sur l'idée que la puissance de calcul disponible n'évolue pas. L'augmentation constante de la puissance disponible serait au contraire un facteur bien plus important dans le développement de l'IA que l'augmentation des connaissances humaines dans le domaine.

    En réponse à un article du site The Next Web plutôt pessimiste sur la capacité de Gato à évoluer vers une IA forte, Nando de Feitas, chercheur chez DeepMind, a clarifié les objectifs de la firme sur Twitter. Selon lui, la route vers l'IA forte est désormais une question d'échelle. Il affirme qu'il n'y a plus besoin de travailler sur la philosophie des symboles que les grands réseaux n'auraient aucun mal à créer et manipuler. Désormais, il faut créer des modèles plus grands, plus efficaces, plus rapides, avec une mémoire plus intelligente, et la recherche doit aller en ce sens.

    Gato est en réalité moins complexe que beaucoup d'autres IA spécialisées, avec 1,2 milliard de paramètres, en comparaison avec les 170 milliards du système GPT-3. L'explication est qu'ils ont souhaité que Gato puisse commander un bras robotique en temps réel. Avec un système plus complexe, ils estiment que l'IA serait capable de n'importe quelle tâche.