au sommaire
On connaît bien la fameuse structure en double hélice de la longue molécule d'ADN. On a décrypté le code génétique, qui explique la synthèse des protéines. Mais le génome recèle encore bien des mystères. © Wellcome Images, Flickr, cc by nc nd 2.0
Entre les années 1960 et 1990, les généticiensgénéticiens ont décrypté le code génétique et découvert la manière dont les gènes sont lus - transcrits - pour fabriquer des protéines. Mais dans le même temps apparaissaient de très énigmatiques fractions des chromosomes qui semblaient ne servir à rien, ne codant pour aucune protéine. Comme si des suites de lettres aléatoires venaient polluer un texte. Ces portions non codantes appelées introns se retrouvaient entre les gènes et venaient même les entrelarder, à la manière des coupures publicitaires dans un film.
Les scientifiques se sont d'abord intellectuellement débarrassés de cette bizarrerie en qualifiant ce charabia apparent « d'ADN poubelle ». Mais ce classement ne satisfaisait personne, d'autant qu'il est apparu que cette partie non codante est très largement majoritaire dans le génomegénome : chez l'être humain, il en représente plus de 90 % !
C'est à cet EverestEverest des mystères de la génétique que s'est attaqué en 2003 le projet Encode, pour Encyclopedia of DNADNA Elements, l'encyclopédie des éléments de l'ADNADN, lancé par le NHGRI (National Human Genome Research Institute), aux États-Unis. Il a regroupé près de 500 chercheurs de 32 laboratoires des États-Unis, d'Espagne, du Japon, du Royaume-Uni, de Singapour et de Suisse. Entre 2003 et 2007, les scientifiques se sont focalisés sur le séquençage de 1 % du génome humain, dont on savait qu'il s'agissait de vrais gènes. De 2007 à 2012, le projet Encode s'est tourné vers les 99 autres pourcents, en analysant 147 types cellulaires humains et vient de publier ses derniers résultats dans la revue Nature.
Les chercheurs n'ont pas fait que séquencer des fragments d'ADN. Ils ont aussi longuement étudié l'activation de gènes dans différents types cellulaires humains ainsi que chez les animaux. On voit ici le résultat de colorations témoignant de l'activité de certains gènes chez un embryon de souris (à gauche) et chez un poisson (à droite). © Encode Project Consortium / Nature
À la poubelle, l’ADN poubelle !
Non « l'ADN poubelle » n'est pas un fatras de résidus inutiles. Le premier chiffre à retenir est 80,4 % : c'est la proportion de l'ADN biologiquement actif chez l'Homme dans au moins un de ses types cellulaires. Alors que la portion du génome humain codant pour des protéines est estimée entre 3 et 8 %, l'essentiel du reste sert donc à quelque chose... Les équipes du projet Encode décrivent ces 80 % comme un ensemble « d'interrupteurs », c'est-à-dire des régions qui contrôlent l'activité d'autres gènes. Ces chercheurs ont dénombré quatre millions de sites de ce genre.
Ces régulateurs fonctionnent de différentes manières. Ils peuvent fixer des protéines qui, elles, camoufleront ou bien activeront des gènes, voisins ou non. D'autres seront traduits en ARNARN, lesquels ne serviront pas à fabriquer des protéines mais iront réguler, d'une façon ou d'une autre, l'activité d'autres gènes.
Les équipes de l'Encode ont précisément identifié environ 50.000 séquences dans l'ADN humain :
- 21.000 gènes codant pour des protéines,
- 8.800 segments qui donneront des ARN courts,
- 9.600 qui conduiront à des ARN longs non traduits en protéines,
- 11.224 « pseudogènespseudogènes », des segments qui ressemblent à des gènes mais qui ne sont jamais traduits en protéines, que l'on considère (jusqu'à preuve du contraire) comme des gènes morts, voire fossilesfossiles.
Ce catalogue servira maintenant à la communauté scientifique pour mieux étudier l'activité de nos gènes. On remarque déjà qu'il reste encore 20 % de l'ADN à la fonction totalement inconnue mais aussi que l'essentiel de l'activité de nos gènes vient de leur régulation.
Et que là se trouvent sans nul doute bien des secrets du bon fonctionnement de nos cellules mais aussi de nos maladies. Dépendante de l'environnement cellulaire (les cellules voisines, la nourriture, etc.), cette régulation est aussi le lieu d'expression de l'épigénétique, ce domaine à découvrir pour expliquer non pas nos gènes mais la façon dont ils sont utilisés.