100 milliards de bases dans les banques de données sur l'ADN et l'ARN

À lire aussi

100 milliards de bases dans les banques de données sur l'ADN et l'ARN

Recherche

Séquençage de l'ADN

Génome

actualité

• 3 Min

Cela vous intéressera aussi

Les trois membres du projet de base de données internationale de séquences de nucléotides (International Nucleotide Sequence Database Collaboration - INSDC) ont annoncé que leurs répertoires publics d'informations sur les séquences de l'ADN et de l'ARN contiennent désormais plus de 55 millions de séquences, soit l'équivalent de 100 gigabases, ou 100.000.000.000 bases - les composantes moléculaires de l'ADN qui codifient les informations génétiques.

au sommaire

À lire aussi

ADN (modèle moléculaire)

Les trois membres - EMBL-Bank (basée au laboratoire européen de biologie moléculairebiologie moléculaire de l'Institut européen de bioinformatique de Hinxton, Royaume-Uni), GenBank (Etats-Unis) et la Banque de données japonaise sur l'ADN - ont atteint ensemble cette étape clé grâce à leur politique d'échange de données. Les trois organisations partagent leurs données séquentielles moyennant l'échange global d'informations biologiques pour mettre le plus vite possible à la libre disposition de la communauté scientifique toute séquence de nucléotidesnucléotides du domaine public.

Quatre bases - l'adénineadénine (A), la thyminethymine (TT), la guanineguanine (G) et la cytosinecytosine (C) - reliées ensemble par paires forment une longue chaîne pour constituer la double hélice désormais familière de l'acide désoxyribonucléiqueacide désoxyribonucléique (ADN). Les liens entre les paires de base - A étant reliée à T et C à G via des liaisons hydrogénées - peuvent être rompus pour "délier" les deux brins de la double hélice.

Les informations génétiquesgénétiques sont encodées dans l'ADN dans l'ordre où les bases se présentent en séquence. De manière conventionnelle, les séquences peuvent être décrites simplement en énumérant l'ordre des bases individuelles (ou nucléotides) de l'une des deux brins (par ex. CCAAATATGGATT), ceci constituant, avec les annotations identifiant les espècesespèces et les fonctions sources, le type d'informations que contiennent les bases de donnéesbases de données INSDC.

"Il s'agit d'une étape clé de l'histoire des bases de données de séquences de nucléotides, a déclaré Graham Cameron, directeur associé de l'Institut européen de bioinformatique EMBL. Depuis la première donnée enregistrée dans la bibliothèque de données EMBL rendue publique en 1982 jusqu'à la mise à disposition, aujourd'hui, de plus de 55 millions de séquences d'au moins 200.000 organismes différents, ces ressources ont anticipé les besoins des biologistes moléculaires et y ont répondu, souvent dans le contexte d'un grave manque de ressources".

Le projet INSC a été formalisé en février 1987 et les trois bases de données se sont développées dans les années 80: EMBL-Bank, localisée aujourd'hui à l'EBI au Royaume-Uni, a été créée sous le nom de EMBL Data Library à Heidelberg (Allemagne) ; la GenBank américaine a été créée peu de temps après au laboratoire national de Los Alamos, avant d'être déplacée au centre national d'informations biotechnologiques de Bethesda (Etats-Unis); la Banque de données japonaise sur l'ADN a quant à elle été établie à l'institut national de génétique de Mishima en 1986.

David Lipman, directeur du centre national d'informations biotechnologiques de Bethesda, a expliqué pour sa part: "Aujourd'hui, les bases de données de séquences de nucléotides permettent aux chercheurs de partager des génomesgénomes complets, la structure génétique d'écosystèmesécosystèmes entiers, et des séquences associées à des brevets".

Auparavant, les données étaient réparties sur une bande magnétiquebande magnétique et enregistrées manuellement ou sur une disquettedisquette. Cette méthode a été remplacée par des flux de données venant de projets de séquençageséquençage du génome et de l'Office européen des brevets, ce qui garantit que toutes les séquences relevant du domaine public sont publiées le plus rapidement possible. Les chercheurs peuvent également soumettre des données directement à l'une des organisations et, grâce aux modèles harmonisés de données des trois bases de données, les séquences sont échangées automatiquement en 24 heures de manière à rendre les données disponibles via les trois bases.

À l'origine, les séquences étaient enregistrées manuellement à partir de revues scientifiques, mais ce processus a également évolué au fil des ans de telle sorte que la soumission directe de séquences de nucléotides aux bases de données fait désormais partie du processus de publication. Ce principe a également été étendu à d'autres domaines, y compris la protéomique et les modèles de processus biologiques.

"L'INSDC a établi les principes de l'échange de nombreux types d'informations biologiques", a déclaré Takashi Gojobori, directeur du centre d'informations biologiques et de la Banque de données japonaise sur l'ADN. "Étant donné que nous entrons dans l'ère des systèmes biologiques et que les chercheurs commencent à échanger des types complexes d'information, tels que les résultats d'expériences consistant à mesurer les activités de milliers de gènesgènes ou des modèles informatiques de processus entiers, il est important de se féliciter de la réalisation de ces trois bases de données qui ouvrent la voie à l'échange ouvert d'informations biologiques".

par CORDIS Nouvelles

Publié le 31 août 2005 à 7:17

Sciences

Recherche

Un vocabulaire commun pour les bases de données biologiques interopérables

actualité

• 02/07/2005

La sélection de la

Article

À voir aussi

génome humain

récupérer données disque dur formaté

dopage arn messager

adn momie egyptienne

adn memoire informatique

a quoi sert le sequencage du genome

complémentarité des bases arn

10 puissance 9 paires de bases

Mots Clés

Banque de donnée

Gêne

Bases

100 milliards de bases dans les banques de données sur l'ADN et l'ARN

Quels sont les meilleurs aspirateurs légers en 2025 ?

Cet aspirateur balai sans fil Ultenic est affiché à moins de 120 € sur Cdiscount

Cette tondeuse thermique Scheppach à moins de 170 € est indispensable pour votre jardin

Cette machine à café incontournable Nespresso Krups est à petit prix sur Cdiscount

Quels sont les meilleurs aspirateurs silencieux en 2025 ?

Quels sont les meilleurs aspirateurs puissants pour tapis et moquettes en 2025 ?

Nouveaux grille-pains ? Notre avis

Les machines expresso - notre comparatif 2024

Les meilleures piscines gonflables 2024

Cap sur l'e-biologie : le calcul distribué au coeur de la science

Première carte complète du génome du riz

Embrace : standardiser l'accès aux données bioinformatiques en Europe

Bac +5 : sciences, les secteurs d'emplois de demain

Quand a été créée la première banque en France ?

Bac + 5 : le secteur de la banque et de la finance

Banques en ligne, banques traditionnelles : quelles différences ?

Sciences, sectes et religion

Réflexions sur les restrictions budgétaires dans la recherche

Pas de recherche... sans chercheurs !

Univers et Système solaire, les bases de l'astronomie

Premier séquençage du génome d'un arbre : le peuplier

Séquençage du génome : dans un an il vous coûtera 1.000 $

En bref : Google s'engage dans la recherche médicale sur le génome

Un vocabulaire commun pour les bases de données biologiques interopérables

La Terre est-elle unique dans l’univers ? Deux spécialistes, deux réponses différentes

Elle discutait avec Einstein à Princeton, la mathématicienne Yvonne Choquet-Bruhat vient de décéder à 101 ans !

Saturne, cette mystérieuse planète gazeuse du Système solaire

Les fouilles ont « surpassé toutes les attentes » : une cache d’arme monumentale de l’époque romaine découverte au Danemark !

Un carré parfait sous le sable de Mars : découverte fascinante ou simple phénomène naturel ?

On sait désormais pourquoi ces populations de chasseurs-cueilleurs avaient les dents si usées !

À la découverte des secrets les mieux gardés de Vénus avec la mission EnVision

Un satellite top-secret à bord : ce que cache la première mission commerciale d’Ariane 6