Anthropic 周四发布题为"当 AI 自我构建"(When AI builds itself)的研究文章,公开呼吁全球前沿 AI 实验室以协调、可核查的方式放缓乃至暂停模型研发。文章首次披露公司内部数据:截至今年 5 月,合入 Anthropic 代码库的代码逾 80% 由 Claude 生成,工程师人均季度代码产出较 2021—2024 年基准提升约 8 倍。文章由内部研究所负责人玛丽娜·法瓦罗(Marina Favaro)与政策主管杰克·克拉克(Jack Clark)联合撰写,核心警示是 AI 正加速逼近"递归式自我改进"(Recursive Self-Improvement)临界点——届时系统无需人工干预便能自主迭代下一代模型——“可能在大多数机构准备就绪之前便已到来”。
文章援引多项外部基准与内部实验佐证加速趋势:AI 独立完成任务的时限约每四个月翻倍,Claude Opus 4.6 目前可稳定处理耗时 12 小时的任务,预计 2027 年前后覆盖数周级别的复杂工作;Claude Mythos Preview 在内部代码优化测试中实现约 52 倍加速,一年前同类基准仅约 3 倍(熟练工程师约 4 倍);在最复杂的开放式任务中,Claude 的成功率于今年 5 月达 76%,六个月内提升了约 50 个百分点。克拉克估计,完整递归式自我改进的临界点可能在两年内到来。
文章将拟议的全球减速机制类比核武器条约,但坦承核查难度远超以往,“建立核查体系的基础设施与信任用了数十年,而我们没有那么多时间”;单方面暂停只会改变领跑者,而非建立所需的广泛审议机制。Anthropic 计划未来数月召集政策制定者、研究人员及其他 AI 企业开展专项讨论。文章发布时间节点敏感:Anthropic 刚完成估值近 9650 亿美元的 650 亿美元融资,并于本周提交机密 IPO 文件。外界对其动机存疑:风投人、特朗普顾问戴维·萨克斯(David Sacks)指其推行"监管俘获议程";也有声音认为这是为旗舰模型 Mythos 造势的营销手段;宾夕法尼亚大学沃顿商学院教授伊森·莫利克(Ethan Mollick)则评价称,文章兼具自我反思与营销成分,但 Anthropic 对 AI 走向的核心判断真诚且值得关注。