Grâce au deep learning, les chercheurs de l'observatoire astronomique japonais sont parvenus à mettre au point un protocole capable de détecter et de classer les galaxies par catégorie.


au sommaire


    L'apprentissage profond, ou deep learning, semble être désormais devenu un outil aussi commun en sciences qu'un bec Bunsenbec Bunsen ou un microscope. Si le concept prend naissance dans les années 2010, la technique, elle, trouve sa source dans les années 1960, avec l'invention des premiers perceptrons. Basée sur le fonctionnement des réseaux de neuronesneurones artificiels, elle connaît une croissance exponentielle, expliquée par un travail de recherche permanent et la nature même de la technologie, dont le rôle est d'apprendre de manière autonome à distinguer et reconnaître des motifs au sein d'une donnée brute, par exemple un mot dans un fichier audio ou un visage dans une photographiephotographie.

    Un réseau neuronal convolutif

    Parmi les services que le deep learning rend aux scientifiques, sa capacité à cibler et trier des informations dans un immense corps de données n'est pas des moindres. Finis les mois passés à examiner des photographies de l'UniversUnivers distant à la main : les chercheurs peuvent désormais les confier à un réseau neuronal convolutif (CNN), un type de réseau de neurones artificielsréseau de neurones artificiels utilisé dans l'analyse d'images. Afin d'entraîner ce dernier à détecter et distinguer les galaxies spiralesgalaxies spirales des galaxies non spirales, l'équipe de l'observatoire astronomique japonais (NAOJ) a soumis au préalable plusieurs dizaines de milliers d'images à ses yeuxyeux métaphoriques (2.829 galaxies et 51.650 non-spirales) avant de le mettre à l'épreuve.

    Les clichés en question ont été capturés par le télescope Subaru, situé sur le Mauna Kea, à Hawaï. Parmi ses sept instruments principaux, la caméra grand champ Hyper Suprime-Cam (HSC) est un joyau d'optique : avec ses 87 millions de pixels et son CCDCCD ultra-sensible, elle est capable d'observer l'Univers distant dans un niveau de détails impressionnant. Grâce à l'analyse de ces images, les chercheurs espèrent découvrir de nouvelles galaxies, dans les contrées lointaines de notre cosmoscosmos. Et grâce au CNN, leurs attentes ne sont pas déçues.

    Comparaison des images de la <em>Sloan Digital Sky Survey</em> (SDSS) et de l'Hyper Suprime-Cam (HSC) du télescope Subaru. © HSC-SSP, SDSS
    Comparaison des images de la Sloan Digital Sky Survey (SDSS) et de l'Hyper Suprime-Cam (HSC) du télescope Subaru. © HSC-SSP, SDSS

    Un demi-million de galaxies

    Avec un taux de réussite de 97,5 %, l'intelligence artificielle a su identifier un total de 76.635 galaxies spirales sur le demi-million d'images qui lui a été présenté. « Nous avons soumis 561.251 images de galaxies au CNN après entraînement, expliquent les chercheurs dans leur étude, parue dans la revue Monthly Notices of the Royal Astronomical Society. Notre système de classification automatisé détecte efficacement les galaxies et détermine la direction de leurs bras spiraux ».

    Les chercheurs soulignent que la méthode connaît encore certaines limitations, à commencer par le fait que les images d'entraînement ont été sélectionnées par des humains, dotés de leurs propres biais cognitifs et visuels. « La création de fausses images à partir de simulations numériquessimulations numériques est l'une des nombreuses méthodes efficaces pour préparer un important corps de données pour un entraînement. [Une autre consiste à adopter] une approche d'apprentissage non supervisé, qui ne requiert pas de groupes de données triées visuellement. »