Des chercheurs en intelligence artificielle chez IBM ont développé une IA chimiste capable de prédire les réactions de synthèse. Philippe Schwaller, un des concepteurs de ce modèle appelé IBM RXN for Chemistry, révèle à Futura son fonctionnement et les espoirs qu'il suscite.


au sommaire


    Réunir la chimiechimie et les technologies de l'intelligence artificielle (IA), c'est ce qu'ont réussi à faire des chercheurs d'IBM Research, à Zurich (Suisse), offrant un coup de jeune à la chimie organique. « Je voulais une applicationapplication concrète de ces méthodes d'IA dans un domaine en relation avec les sciences des matériaux », déclare Philippe Schwaller à Futura. Celui-ci a développé, avec ses collègues Théophile Gaudin et Teodoro Laino, un modèle basé sur le deep learning (apprentissage profondapprentissage profond) pour prédire les produits majoritaires d'une réaction chimiqueréaction chimique à partir des moléculesmolécules de départ, les réactifsréactifs.

    On compte deux siècles d'histoire pour la chimie organique, branche de la chimie qui s'intéresse aux composés du carbonecarbone. On peut même faire remonter ses origines à plusieurs millénaires, en reconnaissant par exemple la contribution des savoirs et pratiques traditionnelles (pharmacopée, décoctions, etc.) des peuples indigènesindigènes, dont la recherche pharmaceutique est le penchant de nos sociétés occidentales. L'intelligence artificielle, quant à elle, est ultramoderne. Inaugurera-t-elle une nouvelle ère pour la chimie ?

    Théophile Gaudin et Philippe Schwaller ont développé <em>IBM RXN for Chemistry</em>, un modèle qui prédit les produits d’une réaction chimique. © IBM Research, Flickr, CC by-nd 2.0
    Théophile Gaudin et Philippe Schwaller ont développé IBM RXN for Chemistry, un modèle qui prédit les produits d’une réaction chimique. © IBM Research, Flickr, CC by-nd 2.0

    L'outil assimile la chimie à un langage

    Comment cet outil, baptisé IBM RXN for Chemistry, procède-t-il ? Il n'est pas doué de prescience, mais a reçu un entraînement sur près de deux millions de réactions chimiques provenant de brevets et de manuels. En décembre dernier, quand les chercheurs ont présenté leur modèle pour la première fois, celui-ci prédisait les réactions avec succès dans 80,3 % des cas, surpassant tous les autres outils de prédiction disponibles. Cette belle réussite a également été annoncée par une publication dans la revue Chemical Science.

    « On a été surpris de voir à quel point cela marchait et cela nous a encouragés à continuer », se souvient Philippe Schwaller. Ainsi, en août dernier, lors de la conférence de l'American Chemical Society, à Boston (États-Unis), le modèle a amélioré son score, atteignant 89 % de réussite. « Ce que ce modèle a de notable comparé à d'autres modèles existants, c'est qu'une fois entraîné, il n'a plus besoin d'une base de données où rechercher une réaction similaire pour essayer de faire pareil », souligne Philippe Schwaller. Autre point important : il peut travailler sur des molécules organiques qu'il n'a jamais vues auparavant.


    Philippe Schwaller et Théophile Gaudin présentent dans cette vidéo le modèle d’IA qu’ils ont développé pour prédire les réactions chimiques. Pour obtenir une traduction en français assez fidèle, cliquez sur le rectangle blanc en bas à droite. Les sous-titres en anglais apparaissent alors. Cliquez ensuite sur la roue dentée à droite du rectangle, puis sur « Sous-titres » et enfin sur « Traduire automatiquement ». Choisissez « Français ». © IBM Research, YouTube

    Pour donner ses prédictions, l'outil s'inspire des modèles de linguistique, plus précisément de traduction. « Ces méthodes du langage fonctionnent bien en chimie, car il y a plein de similarités », explique Philippe Schwaller. « Dans une langue, un "ne" placé quelque part change toute la phrase en négation. Les modèles qui peuvent réaliser que ces petits changements sont importants peuvent voir ça sur les réactions. » Cette comparaison est d'autant plus intuitive qu'il existe déjà en chimie un langage symbolique, appelé Smiles (Simplified Molecular-Input Line-Entry System), pour représenter les molécules de manière simplifiée dans une sorte de « format texte », à savoir une séquence de caractères composée de chiffres et de lettres. Par exemple, la 2,6-dibromopyridine devient BrC1CNCC(Br)C1 en Smiles.

    « C'est similaire à ce que fait Google Traduction avec une langue », poursuit Philippe Schwaller, sauf que les mots sont des Smiles de molécules et que les petits changements en question sont des fonctions, c'est-à-dire des groupes d'atomesatomes responsables des propriétés chimiques, qui gouvernent le déroulement de la réaction. Le modèle peut « prédire le produit majoritaire de la réaction tout en indiquant quels atomes des réactifs étaient importants pour arriver aux produits ».

    <em>IBM RXN for Chemistry</em> a prédit le produit (<em>product</em>, en anglais sur le schéma de droite) de la réaction entre les réactifs (<em>reactants</em>), la 2,6-dibromopyridine et l’éthanolate. Le graphique à gauche indique en rouge quels atomes étaient importants pour prédire la réaction. Les Smiles des réactifs figurent en abscisse (à l’horizontale) et le Smiles du produit est en ordonnée (à la verticale). © IBM Research, Flickr, CC by-nd 2.0
    IBM RXN for Chemistry a prédit le produit (product, en anglais sur le schéma de droite) de la réaction entre les réactifs (reactants), la 2,6-dibromopyridine et l’éthanolate. Le graphique à gauche indique en rouge quels atomes étaient importants pour prédire la réaction. Les Smiles des réactifs figurent en abscisse (à l’horizontale) et le Smiles du produit est en ordonnée (à la verticale). © IBM Research, Flickr, CC by-nd 2.0

    IBM RXN for Chemistry est disponible gratuitement sur le cloud

    Quelles applications pour un tel outil ? « On aimerait bien qu'il accélère le développement de nouvelles molécules », confie à Futura Philippe Schwaller. « On pourrait trouver des raccourcis pour des synthèses et réduire le temps de développement à une fraction de ce qu'il est actuellement ». Car aujourd'hui encore, la chimie organique brille par sa complexité : on connaît des millions de molécules et des milliers de réactions. Synthétiser de nouveaux composés reste un véritable casse-tête.

    En attendant de voir s'il sera effectivement un accélérateur de la recherche, l'outil est disponible gratuitement sur le cloud d'IBMIBM depuis le mois d'août. « Je pense que c'est la première fois qu'un modèle comme celui-là est si facilement accessible », estime Philippe Schwaller. L'application IBM RXN for Chemistry permet aux chimistes de prédire des réactions, mais aussi de collaborer en ligne sur des projets, comme le développement de synthèses complexes ou la recherche d'une nouvelle réaction.

    Cette facilité d'accès est bénéfique pour améliorer le modèle lui-même. « Si le modèle prédit une molécule absurde, les utilisateurs peuvent suggérer quel devrait être le produit de la réaction », indique Philippe Schwaller. « On peut ensuite ré-entraîner le modèle avec les réactions corrigées. » Dans ces conditions, plus le modèle est sollicité, plus il apprendra. Il est d'ailleurs sur la bonne voie puisque l'application compte déjà quelques milliers d'inscrits. « C'est incroyable de faire cette recherche et de voir que des personnes s'y intéressent », se réjouit Philippe Schwaller. « Avec des ressources plutôt limitées, on a produit quelque chose qui a quand même de l'impact. »