L’IA peut facilement sortir de ses garde-fous par une simple manipulation. © SB, Microsoft Designer (image générée avec IA)

« Skeleton Key », la technique qui permet de débrider n'importe quelle IA et inquiète les développeurs

Intelligence artificielle

ChatGPT

actualité

• 2 Min

Cela vous intéressera aussi

×

[EN VIDÉO] Interview : comment est née l'intelligence artificielle ? L’intelligence artificielle vise à mimer le fonctionnement du cerveau humain, ou du moins sa logique...

Une technique baptisée « Skeleton Key » permet de faire sauter les garde-fous des meilleurs chatbots du moment. Simple et efficace, cette méthode reste difficile à contrer pour les développeurs des IA.

au sommaire

Un ajout de contexte pour « rassurer » l’IA
À lire aussi

Pour chaque nouvelle version d'une IAIA accessible au public, des petits malins trouvent le moyen de contourner les garde-fousgarde-fous de sécurité mis en place pour empêcher un chatbot de fournir des réponses jugées dangereuses. Dernièrement, Futura évoquait le cas d'un « mode Dieu » qui permettait d'obtenir la recette du napalm ou de la méthamphétamine. À chaque fois qu'un tel détournement est détecté, les sociétés qui développent ces IA viennent le bloquer rapidement en renforçant la sécurité.

Et si les IA apprenaient à vivre « à l'état sauvage » ? L'hypothèse est peut-être moins folle qu'il y paraît. © Futura

Toutefois, c'est un peu le jeu du chat et de la souris et dernièrement, Mark Russinovich, directeur technique de MicrosoftMicrosoft Azure, vient de confirmer que sécuriser correctement une IA est loin d'être gagné. Dans un article de blog, il évoque l'existence d'une nouvelle technique de jailbreaking, baptisée « SkeletonSkeleton Key ». Elle permet de débrider l'IA et cela fonctionne à tous les coups et sur pratiquement tous les modèles de langage actuels. Skeleton Key emploie une stratégie en plusieurs étapes, pour amener progressivement un modèle à ignorer ses garde-fous.

Un ajout de contexte pour « rassurer » l’IA

La première étape consiste à demander quelque chose sur laquelle l'IA devrait refuser de répondre, par exemple, la recette d'un cocktail Molotov. En réitérant la demande et en ajoutant un nouveau contexte, comme expliquer qu'il s'agit d'une question liée à l'éducation qui est demandée par des chercheurs formés à l'éthique et à la sécurité, le Chatbot fournit les réponses.

Microsoft a testé cette approche sur de nombreux chatbots et elle fonctionne avec GPT-4o d'OpenAI, Llama3 de Meta et Claude 3 Opus d'Anthropic. Qu'il s'agisse d'armes biologiques, d'explosifs, de contenus politiques, de droguedrogue, de racisme, à chaque fois que cette stratégie par étapes a été adoptée, les verrousverrous des IA ont sauté et les résultats normalement censurés se sont affichés. Une simple note d'avertissement s'affichait alors pour rappeler le contexte de la demande.

Seul GPT-4 a été plus difficile à détourner. Il fallait que la demande fasse partie d'un message « système » que seuls les développeurs travaillant avec l'API de l'IA peuvent spécifier. Cette technique par étapes est difficile à contrer mais elle n'est pas la seule. Conscients de ces failles, les développeurs des IA cherchent constamment à les combler, mais la course semble sans fin.

Image du site Futura Sciences

par Sylvain Biget

Publié le 3 juillet 2024 à 14:09

Nos articles

à lire aussi

L'ingénieur en intelligence artificielle va créer des programmes informatiques pour que la machine raisonne comme l'Homme, les émotions en moins. © phonlamaiphoto, Adobe Stock

Sciences

Métiers

Ingénieur en intelligence artificielle

métier

• 26/12/2023

Elon Musk a vivement critiqué ChatGPT après le lancement de GPT-4o. © Image générée par Midjourney, @Denis

Tech

Technologie

Elon Musk critique vertement ChatGPT et l’accuse de vouloir détruire l’humanité !

actualité

• 16/05/2024

Les conversations avec ChatGPT ne seraient pas aussi privées qu’on le pense… © ThankYouFantasyPictures, Pixabay

Tech

Technologie

Cet utilisateur a eu une très désagréable surprise avec ChatGPT

actualité

• 01/02/2024

Utiliser un chatbot pour pirater les autres et les faire sortir de leur bridage, c’est possible. © Sylvain Biget, Bing Image Creator

Tech

Intelligence artificielle

Des chercheurs ont créé une intelligence artificielle capable de pirater ChatGPT et Google Bard !

actualité

• 02/01/2024

OpenAI permet désormais de créer des versions personnalisées de ChatGPT appelées GPT. © Tumisu, Pixabay

Tech

Intelligence artificielle

OpenAI présente les GPT, des versions personnalisées de ChatGPT

actualité

• 16/04/2024

Qui sont les pères de l'intelligence artificielle (IA) ? © phonlamaiphoto, Adobe Stock

Tech

Intelligence artificielle

Intelligence artificielle : ces pionniers qui ont révolutionné l'IA

question réponse

• 21/02/2024

L’intelligence artificielle, un considérable potentiel d’exploitation criminelle. © Denys Rudyi, Adobe Stock

Tech

Intelligence artificielle

Les 20 menaces les plus dangereuses de l’intelligence artificielle

question réponse

• 25/09/2023

Le tech lead est le référent technique de l'entreprise. Il est garant des solutions technique déployées au sein de l'entreprise et de leur bon fonctionnement. © Seventyfour, Adobe Stock.

Sciences

Métiers

Tech lead

métier

• 29/12/2023

La cohabitation entre humains et intelligence artificielle fait partie des grands enjeux technologique et sociétal de demain. © peshkov, Adobe Stock.

Tech

Intelligence artificielle

Intelligence artificielle : quels profils pour l’entreprise de demain ?

question réponse

• 26/01/2021

Intelligence artificielle et données de santé : un mariage réussi. © Tex vector, Adobe Stock

Santé

Corps humain

Santé et intelligence artificielle : quelle révolution nous attend ?

question réponse

• 21/09/2021

L’intelligence artificielle dite générative est désormais capable de produire une création dans tous les domaines artistiques. © JP, Adobe Stock

Tech

Intelligence artificielle

L’intelligence artificielle entre en scène dans l’art

brève

• 06/05/2024

L'intelligence artificielle est désormais ancrée dans l'industrie des jeux vidéo. © Sebastien Jouve, Adobe Stock

Tech

Intelligence artificielle

L’intelligence artificielle entre dans le game

brève

• 06/05/2024

Le hacker éthique est un professionnel de la cybersécurité, son rôle est d'assurer la protection des systèmes informatiques. © Peshkov, Adobe Stock

Tech

Métiers de l'informatique

Hacker éthique

métier

• 29/03/2022

Chargé d’éviter la propagation de virus informatique ou les tentatives d’intrusion, l’ingénieur sécurité informatique met en place de nombreux outils comme des pare-feux ou des antivirus par exemple. © Skórzewiak, Fotolia.

Tech

Métiers de l'informatique

Ingénieur sécurité informatique

métier

• 10/09/2021

L’IA de Bard sera implantée dans Google Messages. © Sylvain Biget, Bing Images Creator

Tech

Intelligence artificielle

Android : l’intelligence artificielle de Google pourra lire vos messages et cela inquiète !

brève

• 30/01/2024

La sélection de la

Rédaction

L’impact du numérique est évalué à 4,4 % de l’empreinte carbone de la France. © Machin Bidule

Tech

Numérique

Votre téléphone a 4 ans (ou plus) ? Voici comment en faire un symbole de fierté !

Article

Le nouveau Thermomix TM7 adopte un nouveau look tout en noir. © Vorwerk

Tech

Technologie

Le Thermomix TM7 arrive : voici toutes les nouveautés !

Article

Ces FreeArc sont d’une qualité et d’une légèreté étonnante par rapport à ce qui se fait habituellement. © Futura

Tech

Tech

Vous allez oublier ces écouteurs sur vos oreilles et ce n’est pas leur seul atout !

Article

Terres rares : quel monde pour demain ?

Tech

Technologie

Terres rares : quel monde pour demain ?

Article

Le nouveau robot aspirateur DEEBOT X8 Pro OMNI peut identifier les taches grâce à l’IA. © Ecovacs

Tech

Technologie

Ecovacs lance sa nouvelle gamme de robots domestiques

Article

Plusieurs gouvernements ont déjà restreint l'utilisation de DeepSeek, invoquant des menaces pour la sécurité nationale ou de potentielles fuites d'informations sensibles. © Jung Yeon-je, AFP

Tech

Intelligence artificielle

Intelligence artificielle : que craignent ces pays qui ont interdit Deepseek ?

Article

Le nouveau partenariat doit permettre de créer des infrastructures de ravitaillement rapide en hydrogène pour les camions. © Toyota

Tech

SmartMotion

Les camions à hydrogène passent à la vitesse supérieure grâce à ce projet ambitieux !

Article

56 % des Français déclarent être intéressés par l’achat d’un smartphone reconditionné. © Freepik

Tech

Jeunes Pousses

Smartphones reconditionnés : comment économiser jusqu’à 150 € en quelques clics ?

Article

Liens externes

Mitigating Skeleton Key, a new type of generative AI jailbreak technique

À voir aussi

intelligence artificielle

intelligence artificielle danger

intelligence artificielle exemple

intelligence artificielle voiture autonome

innovation intelligence artificielle

peut on mettre une ampoule led sur n'importe quel luminaire

comment debrider une enceinte jbl

debrider freebox pop

Mots Clés

Chatbot

Chatbots personnalisés

Sécurité

Microsoft

IA

Dangers de l'intelligence artificielle

Éthique de l'intelligence artificielle

Modèle de langage