au sommaire
« Les bases de donnéesbases de données génomiquesgénomiques existantes sont une ressource inestimable pour la recherche biomédicale, mais elles ne sont pas accessibles au public, ou protégées par des procédures de demande longues et épuisantes, dues à des préoccupations éthiques légitimes. » Ce constat est celui de Burak Yelmen, chercheur en génétique des populations. Il est l'un des auteurs d'une récente étude, parue dans PLOS Genetics, qui propose une solution à cet « obstacle scientifique majeur ».
L'idée ? De faux génomes humains, générés par des machines à apprentissage automatique. Les progrès de l'algorithmie et de l'informatique permettent de produire des données artificielles, similaires à des données authentiques. « Ces génomesgénomes, émergeant de bruits aléatoires, imitent les complexités que nous pouvons observer au sein de populations humaines réelles et, pour la plupart des propriétés, ne se distinguent pas des autres génomes de la biobanque utilisés pour entraîner notre algorithme », souligne Luca Pagani, coauteur de l'étude.
Un seul détail différencie ces génomes produits des génomes humains : ils n'appartiennent à personne. Adieu, soucissoucis d'éthique ! D'autant que ces créations semblent être suffisamment éloignées de génomes réels pour que la confidentialitéconfidentialité des échantillons originaux soit respectée. « La combinaison de plusieurs mesures statistiques nous a permis de vérifier soigneusement tous les modèles », atteste Flora Jay, coautrice et chercheuse en informatique.
Suivez Futura sur WhatsApp et Google Actualités
pour ne rien rater de l’actualité sciences & tech !