Pour générer une image, les IA passent par une centaine d’étapes. Pour accélérer le mouvement et réduire la puissance de calcul nécessaire pour les produire, des chercheurs du MIT sont parvenus à condenser ces étapes en une seule.


au sommaire


    Les générateursgénérateurs d'images populaires, comme Dall.e, Midjourney ou Stable DiffusionDiffusion permettent de créer une image en quelques secondes à partir du texte, mais pour y parvenir, le traitement passe en réalité par une centaine d'étapes. Des scientifiques du MIT (Massachusetts Institute of Technology) sont parvenus à condenser ces étapes en une seule avec comme effet un affichage du résultat 30 fois plus rapide.

    Concrètement, lors de la création d'une image à partir d'un texte, Dall.e ou Midjourney vont piocher dans leur base de données une image aléatoire dont l'esprit correspond plus ou moins avec ce qui est demandé. Ensuite, l'image est progressivement détruite en y ajoutant ce que l'on appelle un champ de bruit aléatoire. Après cette étape clé, elle va en subir une centaine d'autres pour éliminer le bruit et produire une image qui reprend les caractéristiques décrites dans le texte. Pour réduire ces étapes à une seule, les scientifiques ont mis au point une technique appelée « distillation par correspondance de distribution » (DMD pour Distribution Matching DistillationDistillation, en anglais). 

    Au lieu de reconstruire une image, le modèle DMD va extraire de sa base un maximum d’images correspondant à la demande. Ensuite, il va chercher celles qui correspondent le plus à ce que l’on peut rencontrer dans le monde réel. © parktaesung89

    Moins d’étapes pour moins de puissance de calcul

    Pour réduire la duréedurée du traitement, DMD est doté de deux composants. Le premier, s'appelle « perte de régression ». Il organise les images en fonction de similarité durant la phase d'entraînement. Cela permet à l'IAIA d’apprendre plus rapidement. Le second porteporte le nom de « perte de correspondance de distribution ». Cette fonction permet de garantir que la génération d'une image corresponde le plus à ce que l'on trouve fréquemment dans le monde réel.

    Ces deux techniques permettent alors de minimiser l'aspect parfois étrange des images générées par les IA et surtout d'aller bien plus rapidement dans le traitement. Dans cette nouvelle approche avec IA, les chercheurs expliquent qu'en plus de réduire la durée du traitement, cela va également minimiser la puissance de calcul nécessaire pour générer des images.