Ce sont deux des concepts les plus souvent évoqués en intelligence artificielle. Qu’est-ce qui distingue exactement le machine learning du deep learning ?


au sommaire


    Si l'on vous parle d'intelligence artificielle, deux termes vont tôt ou tard apparaître dans la conversation :

    • machine learning ;
    • deep learning.

    Quelle peut bien être la distinction ? Si nous voulons faire simple, nous pouvons dire que le deep learning fait partie du machine learning, et qu'il en a fortement étendu les possibilités.

    Si l'on pose que le machine learning consiste à amener un ordinateur à pouvoir apprendre à accomplir n'importe quelle tâche, quelles sont ses limites et pourquoi celles-ci ont été comblées par le deep learning ? La différence peut être énoncée ainsi : linéaire versus non linéaire...

    Ligne droites versus lignes courbes

    Le machine learning tout comme le deep learning analyse des phénomènes divers et ceux-ci peuvent être représentés par des séries de points sur un graphe. Tous deux développent des algorithmes et s'acharnent à minimiser les erreurs entre le modèle mathématique et la vie réelle. Or, c'est là qu'apparaît la différence essentielle :

    • le machine learning vise à produire une droite la plus proche possible des ensembles de points ;
    • le deep learning vise à produire une courbe la plus proche possible des points.

    Et, comme dans la vie réelle, peu de phénomènes sont linéaires, le deep learning obtient une formule mathématique beaucoup plus précise.

    Le <em>machine learning</em> vise à produire une droite la plus proche possible d’un ensemble de points. © D. Ichbiah généré avec Dall-e 3
    Le machine learning vise à produire une droite la plus proche possible d’un ensemble de points. © D. Ichbiah généré avec Dall-e 3
    Le <em>deep learning</em> vise à produire une courbe la plus proche des points observés. © D. Ichbiah généré avec Dall-e 3
    Le deep learning vise à produire une courbe la plus proche des points observés. © D. Ichbiah généré avec Dall-e 3

    Le deep learning repose sur les réseaux de neurones

    Il a été nécessaire d'aller plus loin que le machine learning de base dès lors que l'intelligence artificielle a abordé des problèmes complexes tels que la reconnaissance d'images ou le pilotage d'un véhicule autonomevéhicule autonome dans une ville telle que San Francisco avec des conditions de circulation complexes.

    Pour ce faire, un algorithme de deep learning élabore un ensemble de règles qui, combinées, vont pouvoir reconnaître qu'un chat est bien un chat dans toutes de situations, angles de vue, types de pelage, etc.

    À cette fin, le deep learning s'appuie sur une approche appelée « réseau neuronal », ou réseau de neurones artificielsréseau de neurones artificiels, soit un réseau de fonctions connectées entre elles. De fait, « deep » signifie profond et reflète le nombre de couches impliquées dans l'élaboration de l'algorithme. Plus il y a de couches et plus le système est profond.

    Représentation figurative d’un réseau de neurones artificiels tel que l’utilise le<em> deep learning</em>. « Deep » signifie profond et reflète le nombre de couches mises à contribution dans l’élaboration de la formule mathématique la plus adéquate possible. © D. Ichbiah généré avec Dall-e 3
    Représentation figurative d’un réseau de neurones artificiels tel que l’utilise le deep learning. « Deep » signifie profond et reflète le nombre de couches mises à contribution dans l’élaboration de la formule mathématique la plus adéquate possible. © D. Ichbiah généré avec Dall-e 3

    Ingurgiter de très vastes volumes de données

    Initialement, des travaux tels que la reconnaissance de la parole ont été confiés à des algorithmes de machine learning. Et puis, au fil des découvertes de chercheurs tels que Geoffrey Hinton, ce type de recherche a pu être confié à des systèmes de deep learning et il a ainsi atteint une précision hors pair, comme avec Whisper d’OpenAi.

    De fait, si le deep learning a connu un essor majeur à partir des années 2000, c'est pour deux raisons principales :

    • il nécessite de gigantesques volumesvolumes de données pour construire des algorithmes fiables. Or, à partir des années 2000, des sites tels que GoogleGoogle ou FacebookFacebook ont fourni les volumes de données attendues ;
    • la montée de la puissance de calcul des ordinateurs a permis d'appliquer plus aisément le deep learning à de tels volumes de données.

    C'est le deep learning qui est à la base de la plupart des systèmes d'intelligence artificielle qui sont apparus depuis 2022 : ChatGPT, HeyGen, Midjourney...