博主分析称教皇利奥十四世AI通谕《宏伟人性》部分段落疑由Claude生成,梵蒂冈未回应

5月25日,教皇利奥十四世正式发布了他的首部通谕《Magnifica Humanitas》,主题是‘人工智能时代下对人类的保护’。这是天主教会迄今为止就人工智能议题发布的最高级别官方文件。在发布仪式上,Anthropic公司的可解释性研究员克里斯·奥拉也出席并发表了演讲。次日,博主Linch在Substack和LessWrong平台上发表了一篇长文分析,称自己掌握了诸多证据,认为这份通谕有相当一部分内容是由人工智能协助撰写的,其中最有可能的工具就是Anthropic旗下的Claude。他的核心证据链包括:AI检测工具Pangram判定部分段落由AI生成的概率介于40%至100%之间;而对前几任教皇方济各与本笃发布的通谕进行回溯测试后,结果均为0%,说明这些文本并非AI产物;通谕的意大利语原版同样被Pangram标记出较高的AI生成概率,甚至高于英文译本,由此排除了翻译过程引入误差的可能;此外还有Claude的一些典型行文特征——比如副词“genuinely”的高频使用,虽然Anthropic在内部系统提示中明确要求限制该词的使用,但作者发现这一限制的实际效果并不明显;再就是通谕中大量出现了三段式排比结构,这种用法的频率远远超过了以往历任教皇发布的通谕。

作者也坦言,将AI参与写作的具体来源指向Claude的依据‘较为主观且难以明确表述’,因此这一判断的可信度要低于‘AI参与了通谕撰写’这一更为笼统的结论。他还指出,通谕各个章节中的AI痕迹程度存在显著差异,推测可能是部分枢机主教在起草过程中借助了AI辅助,而利奥十四世本人或许并未直接使用相关工具。截至发稿时,梵蒂冈与Anthropic均未对上述指控作出回应。这篇文章在人工智能安全与理性主义社群中引发了广泛讨论,还被多家平台转载。

Linch / The Linchpin | LessWrong