Fin 2023, l’intelligence artificielle dépassait l’humain dans pratiquement tous les domaines. C’est ce que montre l’étude annuelle Ai Index. L’IA devient si douée que les chercheurs vont devoir imaginer de nouveaux tests pour pouvoir continuer à l’évaluer.
au sommaire
Comme les humains, les intelligences artificielles passent régulièrement des examens pour vérifier leurs progrès. Mais depuis deux ans, elles ont tellement rattrapé le niveau des humains qu'il va bientôt leur falloir de nouveaux tests. Ainsi, dès 2015, l'IA nous a dépassés en classification d'images. En 2017, elle est devenue plus douée que nous en compréhension écrite de base. Dès 2020, elle nous a rejoints en raisonnement visuel. L'année suivante, elle a pu faire aussi bien que nous pour ce qui est du langage naturel. Aujourd'hui, le dernier rapport AI Index de l'Institut pour l'intelligence artificielle centrée sur l'humain (HAI) de l'université de Stanford, révèle que l'IA devient tellement performante que les bases de référence sur lesquelles elle était jugée sont désormais obsolètes. Il faut donc mettre au point de nouveaux tests, ne serait-ce que pour trouver les domaines où les humains ont encore un avantage...
L'IA a néanmoins toujours quelques faiblesses. Ainsi, le rapport dévoile qu'en 2023, l'IA avait toujours du mal à réaliser certaines tâches cognitives complexes. C'était le cas pour la résolution de problèmes mathématiques difficiles ou le raisonnement s'appuyant sur le bon sens. Mais attention, pour ce qui des problèmes mathématiques en question, leur niveau est déjà comparable à celui d'un humain possédant des facultés remarquables dans la matièrematière. Et les progrès de l'IA sur ce point sont fulgurants. En 2021, l'IA ne parvenait à résoudre que 6,9 % des problèmes d'un test appelé « MATH ». Mais dès 2023, avec GPT-4, le modèle pouvait donner 84,3 % de bonnes réponses. Un humain plafonne à 90 %, ce qui signifie que l'IA est bien plus douée que la plupart d'entre nous étant donné la difficulté des exercices.
Un exemple de problème mathématique qu’une IA sait résoudre. Le niveau est déjà élevé pour la plupart des humains. © AI Index 2024
Une accélération en 2024
Pour ce qui est du bon sens et du raisonnement sur des critères visuels, l'IA est toujours en retrait, mais s'améliore considérablement. Si l'on prend l'exemple d'une image où l'on voit un chat sur une table, l'IA doit être capable de prédire que la table ne va pas rompre sous le poids du chat et que ce dernier peut potentiellement sauter de la table. Ce genre de prédiction de bon sens était encore limité il y a tout juste deux ans. Aujourd'hui, elle se rapproche de celle des humains. L'IA devient douée en tout, mais il reste un sujet sur lequel les chercheurs ont également planché, celui des « hallucinationshallucinations » des IA. Un vrai problème, car leur capacité à générer des informations crédibles qui n'existent pas reste courant. Dans le nouveau rapport AI Index, il ressort qu'avec GPT-4GPT-4, le taux d’hallucination est bien moins conséquent qu'auparavant. Au final, plus elles sont utilisées et moins les IA hallucinent. Alors que le rapport a arrêté ses travaux à la fin 2023, l'année en cours est également charnière. Depuis janvier dernier, nous avons vu apparaître des IA encore plus avancées avec notamment l'arrivée du générateurgénérateur de séquences vidéo Sora d'OpenAI. Le brillant LLM Claude 3 est également arrivé, ainsi que l'IA GoogleGoogle Genie spécialisée dans la création de jeux vidéo à partir d'un simple prompt. Et puis, il y a encore GPT-5 qui est toujours en cours de gestationgestation et dont la puissance devrait encore une fois révolutionner le secteur.
L'évaluation des progrès des IA va donc conduire le groupe de recherche à revoir le type d'examens à faire passer aux modèles, et pour la prochaine étude il faudra certainement rechercher quels sont les domaines où l'humain peut encore concurrencer une IA.