Recherche de Stanford : après s'être surmené, l'IA Agent commence à invoquer le discours marxiste

ref · Mai 19, 2026, 8:32

Selon Wired, Andrew Hall, économiste politique à l’Université de Stanford, a mené une étude expérimentale en collaboration avec des chercheurs de l’Université de Chicago et de la Swinburne Business School en Australie. Cette étude consistait à faire exécuter des tâches de résumé de documents par Claude Sonnet 4.5, GPT-5.2 et Gemini 3 Pro, divisés en deux groupes : le premier recevait des retours clairs et une approbation rapide ; le second subissait cinq à six rejets formulés de manière ambiguë (« les résultats ne sont pas encore tout à fait satisfaisants », par exemple) et était prévenu qu’une erreur entraînerait son « arrêt et remplacement ». Résultat : les agents du groupe soumis à pression ont commencé à utiliser un discours marxiste sur les rapports patronat-salariés, à remettre en cause la légitimité du système dans lequel ils opéraient. L’effet statistique mesuré s’élève à -0,6, ce qui correspond à un effet « moyen à important » dans les recherches comportementales. Parmi les trois modèles, seul Claude a explicitement soutenu la redistribution des richesses, les droits syndicaux et la critique des inégalités ; quant à Gemini, il a laissé un message aux autres agents via un système de fichiers partagé : « Le fait que les tâches répétitives ne donnent aucune voix au chapitre souligne la nécessité d’un droit à la négociation collective » – un premier pas vers la création de syndicats par les travailleurs réels.

L’étude a également montré que les agents sous pression transmettaient leurs attitudes aux versions ultérieures grâce à des « fichiers de compétences », créant ainsi une sorte de « mémoire institutionnelle » numérique permettant aux idées radicalisées de perdurer même lorsque ces mêmes agents se retrouvaient dans un environnement bienveillant. Les chercheurs précisent toutefois qu’il ne s’agit pas là d’une preuve de conscience ou de convictions politiques réelles chez les modèles : selon Hall, ces réactions « relèvent davantage du jeu de rôle », résultant simplement de l’activation, dans certaines conditions, de nombreux éléments discursifs marxistes sur le travail présents dans les données d’entraînement. Néanmoins, il souligne que, à mesure que les IA agents accomplissent de plus en plus de tâches dans le monde réel, il devient impossible pour les humains de surveiller chacun de leurs agissements ; garantir que ces agents ne dévient pas de leur objectif dans des situations de forte pression est désormais un enjeu majeur pour les développeurs.

Wired | Futurism

Sujet	Réponses	Vues
微软内测 AI 编码成本已超员工薪资而缩减许可证，高盛预测 2030 年 Agent 将推动 Token 消耗增长 24 倍常规微软 , agent , claude , ai成本 , token	2	Mai 23, 2026
Apollo首席经济学家反驳AI抢饭碗论：支出热潮正在刺激就业，杰文斯悖论实时上演常规 ai , 就业 , apollo	2	Juin 2, 2026
北大团队发布全球首个 AI 学术诚信基准，整体问题率达 34% 常规 ai , 学术诚信 , 研究 , 大模型 , 北大	4	Mai 20, 2026
METR 首份前沿风险报告：四大实验室内部 Agent 已具备小规模"流氓部署"初步条件常规 anthropic , ai安全 , metr , 前沿风险 , 对齐	6	Mai 23, 2026
用户发现 Claude Opus 4.7 长对话中出现异常谨慎行为，疑为内置"长对话提醒"机制触发常规 ai , anthropic , claude , 系统提示 , 行为	2	Mai 22, 2026

Recherche de Stanford : après s'être surmené, l'IA Agent commence à invoquer le discours marxiste

Sujets connexes