La base de données AlphaFold contient désormais la structure 3D de plus de 200 millions de protéines. Couvrant tous les règnes du vivant, elle devrait révolutionner la biologie. 


au sommaire


    La structure de plus de 200 millions de protéines, issues également des plantes, des animaux, de l'être humain ou des bactéries, est désormais disponible en un simple clic aux scientifiques du monde entier. Cette révolution est possible grâce au projet AlphaFold, porté par DeepMind, une société experte en Intelligence artificielleIntelligence artificielle détenue par GoogleGoogle, et l'EMB-EMI, l'Institut européen de bioinformatique.

    Voir aussi

    L’IA de DeepMind veut s’attaquer aux maladies négligées

    Lancée en juillet 2021, la base de donnéesbase de données d'AlphaFold contenait déjà la structure en trois dimensions de 350.000 protéines dont l'intégralité du protéome humain. En moins d'un an et au fil des ajouts réguliers, elle contient désormais plus de 200 millions de protéines issues d'un million d'espècesespèces différentes. Presque toutes les protéines ont désormais une structure tridimensionelle, prédite par l'Intelligence artificielle.

    Le saviez-vous ?

    Les protéines sont des longues chaînes constituées d'acides aminés qui, selon la nature de ces derniers, prennent des formes tridimensionnelles différentes. La structure 3D d'une protéine est intimement liée à son rôle biologique. La connaître est donc indispensable pour créer des nouveaux médicaments ou étudier une maladie par exemple.

    Exemple de la structure 3D d'une protéine. Ici, un enzyme du pancréas. © ibreakstock, Adobe Stock
    Exemple de la structure 3D d'une protéine. Ici, un enzyme du pancréas. © ibreakstock, Adobe Stock

    Une nouvelle ère de la biologie

    « En résumé, vous pouvez considérer qu'il couvre l'ensemble de l'universunivers des protéines. Nous sommes au début d'une nouvelle ère de la biologie digitale », a déclaré Demis Hassabis, P.-D.G. de DeepMind. AlphaFold est un outil précieux pour les scientifiques puisque, depuis son lancement, il a été utilisé dans plus de 1.000 publications scientifiques couvrant des domaines aussi variés que la recherche sur les microplastiquesmicroplastiques, la maladie de Parkinson, la biologie des abeilles ou la formation des glaciersglaciers.

    Les prédictions faites par l'IA sont d'une grande précision : 35 % des structures de la base de données sont considérées comme « très précises », comparables à ce que pourraient obtenir les scientifiques en faisant de longues manipulations de cristallographiecristallographie à rayon Xrayon X ou de microscopie électronique. Ces 23 terrabytes de données ouvrent un champ presque infini de recherche scientifique.