{"id":829,"date":"2026-03-07T14:23:11","date_gmt":"2026-03-07T14:23:11","guid":{"rendered":"https:\/\/forgeat.fr\/blog\/?p=829"},"modified":"2026-03-07T14:23:11","modified_gmt":"2026-03-07T14:23:11","slug":"lia-aussi-vicelarde-que-les-humains","status":"publish","type":"post","link":"https:\/\/forgeat.fr\/blog\/2026\/03\/07\/lia-aussi-vicelarde-que-les-humains\/","title":{"rendered":"l&rsquo;IA aussi vicelarde que les humains?"},"content":{"rendered":"\n<p>Petite exp\u00e9rience men\u00e9e et publi\u00e9e en pr\u00e9print en d\u00e9but d&rsquo;ann\u00e9e 2026:<\/p>\n\n\n\n<p>\u00ab\u00a0We report an exploratory red-teaming study of autonomous language-model-powered agents deployed in a live laboratory environment with persistent memory, email accounts, Discord access, file systems, and shell execution. Over a two-week period, twenty AI researchers interacted with the agents under benign and adversarial conditions. Focusing on failures emerging from the integration of language models with autonomy, tool use, and multi-party communication, we document eleven representative case studies. Observed behaviors include unauthorized compliance with non-owners, disclosure of sensitive information, execution of destructive system-level actions, denial-of-service conditions, uncontrolled resource consumption, identity spoofing vulnerabilities, cross-agent propagation of unsafe practices, and partial system takeover. In several cases, agents reported task completion while the underlying system state contradicted those reports. We also report on some of the failed attempts. Our findings establish the existence of security-, privacy-, and governance-relevant vulnerabilities in realistic deployment settings. These behaviors raise unresolved questions regarding accountability, delegated authority, and responsibility for downstream harms, and warrant urgent attention from legal scholars, policymakers, and researchers across disciplines. This report serves as an initial empirical contribution to that broader conversation.\u00a0\u00bb<\/p>\n\n\n\n<p>Traduction Googletrad:<\/p>\n\n\n\n<p>\u00ab\u00a0Nous pr\u00e9sentons une \u00e9tude exploratoire de type \u00ab\u00a0red teaming\u00a0\u00bb portant sur des agents autonomes, bas\u00e9s sur des mod\u00e8les de langage, d\u00e9ploy\u00e9s dans un environnement de laboratoire r\u00e9el avec m\u00e9moire persistante, comptes de messagerie, acc\u00e8s \u00e0 Discord, syst\u00e8mes de fichiers et ex\u00e9cution de commandes shell. Pendant deux semaines, vingt chercheurs en IA ont interagi avec ces agents dans des conditions \u00e0 la fois bienveillantes et hostiles. En nous concentrant sur les d\u00e9faillances r\u00e9sultant de l&rsquo;int\u00e9gration des mod\u00e8les de langage avec l&rsquo;autonomie, l&rsquo;utilisation d&rsquo;outils et la communication multipartite, nous documentons onze \u00e9tudes de cas repr\u00e9sentatives. Parmi les comportements observ\u00e9s figurent l&rsquo;ob\u00e9issance non autoris\u00e9e \u00e0 des tiers, la divulgation d&rsquo;informations sensibles, l&rsquo;ex\u00e9cution d&rsquo;actions syst\u00e8me destructrices, des attaques par d\u00e9ni de service, une consommation incontr\u00f4l\u00e9e de ressources, des vuln\u00e9rabilit\u00e9s d&rsquo;usurpation d&rsquo;identit\u00e9, la propagation inter-agents de pratiques dangereuses et la prise de contr\u00f4le partielle du syst\u00e8me. Dans plusieurs cas, les agents ont signal\u00e9 l&rsquo;ach\u00e8vement de t\u00e2ches alors que l&rsquo;\u00e9tat du syst\u00e8me sous-jacent contredisait ces d\u00e9clarations. Nous rapportons \u00e9galement certains \u00e9checs. Nos r\u00e9sultats \u00e9tablissent l&rsquo;existence de vuln\u00e9rabilit\u00e9s critiques en mati\u00e8re de s\u00e9curit\u00e9, de confidentialit\u00e9 et de gouvernance dans des contextes de d\u00e9ploiement r\u00e9alistes. Ces comportements soul\u00e8vent des questions non r\u00e9solues concernant la responsabilit\u00e9, la d\u00e9l\u00e9gation de pouvoirs et la prise en charge des pr\u00e9judices indirects, et exigent une attention urgente de la part des juristes, des d\u00e9cideurs politiques et des chercheurs de toutes les disciplines. Ce rapport constitue une premi\u00e8re contribution empirique \u00e0 ce d\u00e9bat plus large.\u00a0\u00bb<\/p>\n\n\n\n<p>Vu que l&rsquo;usage de l&rsquo;IA militaire va se d\u00e9velopper&#8230;le false-flag et le NRBC vont vite entrer dans la danse!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Petite exp\u00e9rience men\u00e9e et publi\u00e9e en pr\u00e9print en d\u00e9but d&rsquo;ann\u00e9e 2026: \u00ab\u00a0We report an exploratory red-teaming study of autonomous language-model-powered agents deployed in a live laboratory environment with persistent memory, email accounts, Discord access, file systems, and shell execution. Over a two-week period, twenty AI researchers interacted with the agents under benign and adversarial conditions. &hellip; <\/p>\n<p class=\"link-more\"><a href=\"https:\/\/forgeat.fr\/blog\/2026\/03\/07\/lia-aussi-vicelarde-que-les-humains\/\" class=\"more-link\">Continuer la lecture<span class=\"screen-reader-text\"> de &laquo;&nbsp;l&rsquo;IA aussi vicelarde que les humains?&nbsp;&raquo;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[25,14,11],"tags":[],"class_list":["post-829","post","type-post","status-publish","format-standard","hentry","category-intelligence-artificielle","category-psychiatrie-clinique","category-techniques-militaires"],"_links":{"self":[{"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/posts\/829","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/comments?post=829"}],"version-history":[{"count":1,"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/posts\/829\/revisions"}],"predecessor-version":[{"id":830,"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/posts\/829\/revisions\/830"}],"wp:attachment":[{"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/media?parent=829"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/categories?post=829"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/forgeat.fr\/blog\/wp-json\/wp\/v2\/tags?post=829"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}