Articles de presse, plaidoyers ou encore codes informatiques. Les folles capacités de rédaction de ChatGPT fascinent. Mais certains lui prédisent d’ores et déjà un avenir moins radieux. Dès lors que l’Intelligence artificielle se sera heurtée… au mur de la connaissance !
au sommaire
ChatGPTChatGPT. Plusieurs semaines, maintenant, que cet étonnant outil conversationnel fait la Une. Parce qu'il est capable de générer du contenu à la demande. Des articles de presse -- même l'actualité scientifique ? --, des plaidoyers ou encore des codes informatiques. Comment ? En s'appuyant sur une Intelligence artificielle et sur un apprentissage automatique en continu. De quoi lui permettre de devenir de plus en plus performant au fil du temps. Pour ceux que l'idée angoisse un peu, un groupe de chercheurs spécialisés dans l'étude de l'Intelligence artificielle et de ses capacités a peut-être une bonne nouvelle aujourd'hui.
Tout simplement parce que ChatGPT a beau être intelligent, il n'apprend que grâce aux informations disponibles autour de lui. Des informations produites... par des humains. Selon l'étude publiée par lesdits chercheurs, c'est sa boulimieboulimie d'informations qui pourrait bien être fatale à l'Intelligence artificielle. Si elle continue ainsi à consommer des données plus vite que nous pouvons en produire de nouvelles. Les ressources en contenu « de haute qualité » pourraient ainsi être épuisées dès 2026 !
Rappelons que les performances d'une Intelligence artificielle reposent sur les algorithmes et la puissance de calcul. Mais aussi sur la qualité des données injectées dans les modules d'apprentissage. Alors les chercheurs se sont demandé combien de temps encore les Intelligences artificielles de type ChatGPT trouveraient dans leur environnement de quoi progresser.
Une boulimie de connaissance fatale ?
Ils ont estimé la taille du stock de données disponibles et évalué la manière dont il se développe. Ils ont comparé leurs chiffres à la taille et à l'évolution des ensembles de données d'apprentissage de l'Intelligence artificielle. Selon leurs travaux, il y aurait actuellement entre 7x1013 et 7x1016 mots disponibles dans le stock mondial de données de l'humanité. Un stock en croissance de quelque 7 % par an. Une croissance qui diminue. Elle pourrait ne plus être que de 1 % d'ici 2100. Mais le problème est encore ailleurs. Car l'ennui, pour l'Intelligence artificielle, c'est que le stock dans lequel elle puise des informations est déjà aujourd'hui de l'ordre de 2x1012 mots. Et sa croissance est estimée à quelque chose comme... 50 % par an.
Les choses apparaissent encore un peu plus tendues lorsque les chercheurs se penchent sur les données qualifiées de qualité. Les stocks ne seraient pas de plus de 2x1013 mots. Soit environ un ordre de magnitudemagnitude seulement au-dessus de ce qui alimente aujourd'hui les Intelligences artificielles comme ChatGPT.
Se basant sur ces tendances -- observées par le passé et projetées sur le futur --, les chercheurs estiment que la disponibilité de données pourrait devenir un facteur réellement bloquant pour le développement d'Intelligences artificielles quelque part entre 2030 et 2050. Et même dès cette année si l'on considère qu'elles doivent être nourries essentiellement de données de haute qualité. Sauf si, finalement, concernant particulièrement ChatGPT -- qui reste sur le papier, une applicationapplication de conversation --, la quantité de données de langage se révélait plus importante que sa qualité. Car alors, des données produites par des Intelligences artificielles elles-mêmes pourraient potentiellement tout à fait se substituer à celles que nous avions pris l'habitude d'être les seuls à produire...