5月25日,教皇利奥十四世(Pope Leo XIV)正式颁布其首部通谕《宏伟人性》(Magnifica Humanitas),主题为"人工智能时代对人类的护卫",是天主教会迄今就AI话题发表的最高规格官方文件。颁布仪式上,Anthropic 可解释性研究员 Chris Olah 亦出席并发表演讲。次日,博主 Linch 在 Substack 及 LessWrong 发表长篇分析文章,声称掌握多条证据,认为该通谕相当比例的段落由AI(具体而言最可能是 Anthropic 的 Claude)协助撰写。其核心证据链包括:AI检测工具 Pangram 将部分段落标记为40%至100% AI生成概率,而对历任教宗(方济各、本笃)通谕的回溯测试均显示0%;通谕意大利语原文同样被 Pangram 标记(且比英译版更高),排除翻译引入误差的可能性;以及多个 Claude 的已知文体特征——尤其是副词"genuinely"的频繁出现,该词已被 Anthropic 在泄露的内部系统提示中明确限制使用,但据作者观察该限制实际效果有限;此外还包括三段式排比结构(tricolon)的大量使用,频率远超此前历任教宗通谕。
作者同时承认,将 AI 参与笔迹具体归因于 Claude 的部分依据"较为主观且难以言传",判断的可信度低于更宽泛的"AI参与撰写"结论本身,并指出通谕不同章节的 AI 痕迹浓度差异悬殊,推测是部分枢机主教在起草中使用了AI辅助而利奥十四世本人可能未直接使用。截至发文,梵蒂冈与 Anthropic 均未就上述指控作出回应。该文章在 AI 安全和理性主义社区引发广泛讨论,并已获多处转载。