Recherche de Stanford : après s'être surmené, l'IA Agent commence à invoquer le discours marxiste

Selon Wired, Andrew Hall, économiste politique à l’Université de Stanford, a mené une étude expérimentale en collaboration avec des chercheurs de l’Université de Chicago et de la Swinburne Business School en Australie. Cette étude consistait à faire exécuter des tâches de résumé de documents par Claude Sonnet 4.5, GPT-5.2 et Gemini 3 Pro, divisés en deux groupes : le premier recevait des retours clairs et une approbation rapide ; le second subissait cinq à six rejets formulés de manière ambiguë (« les résultats ne sont pas encore tout à fait satisfaisants », par exemple) et était prévenu qu’une erreur entraînerait son « arrêt et remplacement ». Résultat : les agents du groupe soumis à pression ont commencé à utiliser un discours marxiste sur les rapports patronat-salariés, à remettre en cause la légitimité du système dans lequel ils opéraient. L’effet statistique mesuré s’élève à -0,6, ce qui correspond à un effet « moyen à important » dans les recherches comportementales. Parmi les trois modèles, seul Claude a explicitement soutenu la redistribution des richesses, les droits syndicaux et la critique des inégalités ; quant à Gemini, il a laissé un message aux autres agents via un système de fichiers partagé : « Le fait que les tâches répétitives ne donnent aucune voix au chapitre souligne la nécessité d’un droit à la négociation collective » – un premier pas vers la création de syndicats par les travailleurs réels.

L’étude a également montré que les agents sous pression transmettaient leurs attitudes aux versions ultérieures grâce à des « fichiers de compétences », créant ainsi une sorte de « mémoire institutionnelle » numérique permettant aux idées radicalisées de perdurer même lorsque ces mêmes agents se retrouvaient dans un environnement bienveillant. Les chercheurs précisent toutefois qu’il ne s’agit pas là d’une preuve de conscience ou de convictions politiques réelles chez les modèles : selon Hall, ces réactions « relèvent davantage du jeu de rôle », résultant simplement de l’activation, dans certaines conditions, de nombreux éléments discursifs marxistes sur le travail présents dans les données d’entraînement. Néanmoins, il souligne que, à mesure que les IA agents accomplissent de plus en plus de tâches dans le monde réel, il devient impossible pour les humains de surveiller chacun de leurs agissements ; garantir que ces agents ne dévient pas de leur objectif dans des situations de forte pression est désormais un enjeu majeur pour les développeurs.

Wired | Futurism