Les intelligences artificielles seraient vulnérables à l’empoisonnement de leurs données. © David, Adobe Stock

La plus grande menace pour les Intelligences artificielles comme ChatGPT se cache sur Internet

Intelligence artificielle

ChatGPT

Cybersécurité

Internet

actualité

• 3 Min

Cela vous intéressera aussi

×

[EN VIDÉO] Interview : comment est née l'intelligence artificielle ? L’intelligence artificielle vise à mimer le fonctionnement du cerveau humain, ou du moins sa logique...

Il suffirait d’un très faible nombre de changements dans les bases de données utilisées pour entraîner les intelligences artificielles afin de les induire en erreur. Des chercheurs ont découvert deux méthodes pour y parvenir avec la plupart des grandes bases de données utilisées actuellement.

au sommaire

L’attaque de type « split-view poisoning »
Le « frontrunning poisoning »
À lire aussi

L'arrivée des chatbots comme ChatGPTChatGPT soulève des craintes de voir des individus mal intentionnés s'en servir pour créer des arnaques, comme le phishing, plus nombreuses et plus difficiles à déceler. Toutefois, ces intelligences artificielles ont aussi leurs propres faiblesses. Des chercheurs de GoogleGoogle, de l'École polytechnique fédérale de Zurich, Nvidia, et Robust Intelligence ont prépublié un article sur arXiv qui détaille deux attaques possibles contre les IA.

Les deux attaques consistent à modifier, ou « empoisonner » les informations utilisées pour leur entraînement. L’IA n'étant pas capable de repérer les fausses informationsfausses informations, il suffirait de modifier une toute petite partie des données pour qu'elle produise des résultats erronés. Une récente étude chiffre à 0,001 % la quantité de fausses informations nécessaires pour empoisonner le modèle entier. Selon l'utilisation de l’IA, les conséquences pourraient s'avérer dangereuses.

L’attaque de type « split-view poisoning »

La première attaque s'appelle « split-view poisoning », que l'on pourrait traduire par empoisonnement par vue séparée. Les grandes bases de données utilisées contiennent de très nombreuses références à des images, avec une description. Toutefois, ce ne sont pas les images elles-mêmes qui sont incluses, mais des liens pour les télécharger depuis le Web.

Les intelligences artificielles seraient vulnérables à l’empoisonnement de leurs données. © Tara Winstead, Pexels

Les intelligences artificielles seraient vulnérables à l’empoisonnement de leurs données. © Tara Winstead, Pexels

Le problème est que très souvent les noms de domaine des sites qui les hébergent ont expiré. On obtient ainsi 0,29 % de noms de domaines expirés pour le modèle LAION-2B-en qui date de 2022, un chiffre qui monte jusqu'à 6,48 % pour le modèle PubFig de 2010, encore utilisé aujourd'hui. L'attaque consiste à racheter certains de ces noms de domaine pour mettre d'autres images à la place. Ainsi, l'IA sera induite en erreur par les nouvelles images. Les chercheurs ont indiqué qu'il est possible d'empoisonner 0,01 % des bases de données LAION-400M ou COYO-700M pour seulement 60 dollars.

Le « frontrunning poisoning »

La seconde attaque s'appelle « frontrunning poisoning », que l'on pourrait traduire par « empoisonnement par anticipation ». Contrairement à la précédente, elle vise toutes les données, y compris textuelles, mais doit être effectuée avant l'entraînement de l'IA. Les bases de données sont constituées en effectuant des clichés des sources sur le Web à un instant TT. Si l'attaquant peut prédire quand aura lieu ce cliché, il peut modifier les données juste avant. Par exemple, il pourrait modifier des pages sur Wikipédia juste avant leur téléchargement, de manière que les modérateurs n'aient pas le temps de corriger les fausses informations. En se basant sur le temps de réaction moyen pour annuler des modifications erronées, les chercheurs ont estimé qu'il serait possible d'empoisonner jusqu'à 6,5 % des données de Wikipédia, en l'absence de toute autre mesure défensive (comme le blocage de l'adresse IPadresse IP suite à un grand nombre de modifications).

Les chercheurs ont indiqué plusieurs pistes pour se défendre contre ce genre d'attaque. Pour le split-view poisoning, il n'est souvent pas possible d'enregistrer les contenus dans la base de données à cause des droits d'auteur. À la place, il suffirait d'enregistrer un hachage des fichiers qui permettrait de repérer tout changement effectué ultérieurement. Pour le frontrunning poisoning, les chercheurs proposent soit de rendre aléatoire l'ordre de téléchargement des pages afin de rendre plus difficile l'empoisonnement, ou tout simplement de geler les modifications sur le site le temps d'en créer une copie.

Image du site Futura Sciences

par Edward Back

Journaliste hi-tech

Publié le 9 mars 2023 à 15:24

Nos articles

à lire aussi

Pour nous ressembler un peu plus, l’intelligence artificielle de demain sera composée de véritables cellules cérébrales humaines. © Gerd Altmann, Pixabay

Tech

Intelligence artificielle

Voici l'intelligence organoïde pour aller plus loin que ChatGPT

actualité

• 07/03/2023

© HARUMI OZAWA / AFPTV / AFP

Tech

Intelligence artificielle

Le premier manga créé par une Intelligence artificielle sort au Japon cette semaine

actualité

• 07/03/2023

© Tumisu, Pixabay

Tech

Jeunes Pousses

L’intelligence artificielle responsable par Axionable

actualité

• 04/03/2023

10 outils d’Intelligence artificielle qui montrent que nous sommes entrés dans une nouvelle ère. © AndSus, AdobeStock

Tech

Intelligence artificielle

10 applications d’Intelligence artificielle qui préfigurent le futur

actualité

• 31/05/2023

L'IA est présente dans de nombreux aspects de votre vie sans que vous ne l'imaginiez. © Supatman, Adobe Stock

Tech

Intelligence artificielle

L’intelligence artificielle : six usages révolutionnaires au quotidien

question réponse

• 20/02/2024

L’intelligence artificielle, un considérable potentiel d’exploitation criminelle. © Denys Rudyi, Adobe Stock

Tech

Intelligence artificielle

Les 20 menaces les plus dangereuses de l’intelligence artificielle

question réponse

• 25/09/2023

L'ingénieur en intelligence artificielle va créer des programmes informatiques pour que la machine raisonne comme l'Homme, les émotions en moins. © phonlamaiphoto, Adobe Stock

Sciences

Métiers

Ingénieur en intelligence artificielle

métier

• 26/12/2023

Qu'il soit en entreprise ou en cabinet de conseil, le consultant en cybersécurité vient en aide aux décideurs afin d'assurer la protection de leurs données sensibles dans un monde où tout est connecté. © VideoFlow, Adobe Stock

Sciences

EPITA

Consultant en cybersécurité

métier

• 06/10/2022

Qui sont les pères de l'intelligence artificielle (IA) ? © phonlamaiphoto, Adobe Stock

Tech

Intelligence artificielle

Intelligence artificielle : ces pionniers qui ont révolutionné l'IA

question réponse

• 21/02/2024

La cohabitation entre humains et intelligence artificielle fait partie des grands enjeux technologique et sociétal de demain. © peshkov, Adobe Stock.

Tech

Intelligence artificielle

Intelligence artificielle : quels profils pour l’entreprise de demain ?

question réponse

• 26/01/2021

Le cancérologue, appelé aussi oncologue, est spécialisé dans le traitement des cancers ou tumeurs malignes. © Richard Villalon, Forolia.

Santé

Métiers de la santé

Cancérologue

métier

• 12/03/2020

https://datascientest.com/formation-machine-learning-engineer?utm_source=futura-sciences.com&utm_medium=affiliates&utm_campaign=futura_sciences_juin_2021&utm_content=call-to-actionLe machine learning engineer développe des programmes pour que les machines apprennent par elles-mêmes. © phonlamaiphoto, Adobe Stock.

Sciences

Métiers

Machine learning engineer

métier

• 10/06/2021

Ce mardi 1er décembre 2020, les Electric Days et Yann LeCun, Chief IA Scientist de Facebook, nous donnent rendez-vous à 14 heures 45 pour imaginer comme l’intelligence artificielle peut agir comme un accélérateur de la transition énergétique. © ipopba, Adobe Stock

Tech

Intelligence artificielle

L’intelligence artificielle, accélérateur de la transition énergétique ?

brève

• 01/12/2020

Une intelligence artificielle pour dépister la démence ? © Sergii Mostovyi

Santé

Démence

Une intelligence artificielle peut prédire une démence future en lisant sur votre visage

brève

• 08/02/2021

La Mégane E-Tech se différencie quelque peu de la Mégane thermique. S’il s’agit toujours d’une berline compacte, elle est typée SUV. Cette version électrique est basée sur la nouvelle plateforme CMF-EV développée par l’alliance Renault-Nissan-Mitsubishi. © Renault

Tech

Voiture électrique

Découvrez la Mégane E-Tech en photos

diaporama

• 01/06/2022

La sélection de la

Rédaction

Le nouveau partenariat doit permettre de créer des infrastructures de ravitaillement rapide en hydrogène pour les camions. © Toyota

Tech

SmartMotion

Les camions à hydrogène passent à la vitesse supérieure grâce à ce projet ambitieux !

Article

56 % des Français déclarent être intéressés par l’achat d’un smartphone reconditionné. © Freepik

Tech

Jeunes Pousses

Smartphones reconditionnés : comment économiser jusqu’à 150 € en quelques clics ?

Article

Le nouveau vélo Duotts N26 révolutionne la conception du vélo électrique. © Duotts

Tech

SmartMotion

À la découverte du vélo électrique DUOTTS N26 : un vélo tout terrain innovant

Article

Les hôtes Turo gagnent en moyenne 312 euros par mois grâce à la location de leur voiture. © Turo

Tech

Jeunes Pousses

Freiner les frais de son véhicule grâce à l’autopartage

Article

Quels mystères cachés dans vos objets high-tech ?

Tech

Technologie

Quels mystères cachés dans vos objets high-tech ?

Article

Le nouveau robot aspirateur DEEBOT X8 Pro OMNI peut identifier les taches grâce à l’IA. © Ecovacs

Tech

Technologie

Ecovacs lance sa nouvelle gamme de robots domestiques

Article

Les ordinateurs des marques Medion et Erazer sont réputés pour leur fiabilité. © Erazer

Tech

Technologie

Réparés en cas de panne et remboursés ! Les marques Erazer et Medion sont sûres de la qualité de leurs ordinateurs

Article

La tradition horlogère française remonte à plus de 700 ans. © Freepik

Tech

Jeunes Pousses

Chronospedia, la première encyclopédie 3D collaborative dédiée à l'horlogerie

Article

Liens externes

À voir aussi

intelligence artificielle

intelligence artificielle danger

intelligence artificielle exemple

intelligence artificielle voiture autonome

innovation intelligence artificielle

lettre de motivation intelligence artificielle

thèse cifre intelligence artificielle

tipe intelligence artificielle

Mots Clés

Faille vulnérabilité

Empoisonnement