韩国科学技术院(KAIST)、蒙特利尔学习算法研究所(Mila)与纽约大学联合团队,包括图灵奖得主 Yoshua Bengio 与 Sungjin Ahn,5 月 19 日在 arXiv 发布论文,提出生成式递归推理模型 GRAM(Generative Recursive reAsoning Models)。现有递归推理模型(如 HRM、TRM 与循环 Transformer)均为确定性模型:同一输入每次产生完全相同的推理路径,整个合理解空间被压缩至单一吸引子。GRAM 将递归本身改造为潜空间上的随机轨迹,通过摊销变分推断(amortized variational inference)优化,使模型能在给定输入下并行采样多条假设路径,从而将推理时计算扩展从"深度"延伸至"广度"。更重要的是,同一框架既支持条件推理 p(y|x),也天然地作为无条件生成模型 p(x),可独立采样推理问题分布本身。
仅凭 1,000 万参数,GRAM 在多项挑战性基准上取得了明显超越同等规模模型的成绩:Sudoku-Extreme 准确率 97.0%(TRM 同场景为 87.4%)、N-Queens 覆盖率超 90%、ARC-AGI-1 得分 52.0%、ARC-AGI-2 得分 11.1%,与规模大得多的语言模型具有竞争力。论文注记显示,该工作早于 2026 年 3 月以海报形式发表于 ICLR 2026 递归与结构化推理研讨会(Workshop RSI),本次 arXiv 全文为完整版。同期,同样基于递归架构的 HRM-Text(1B 参数预训练模型)亦于本周发布,两项工作为递归推理方向在小参数量离散推理场景和大规模语言模型场景的双线推进提供了新的实证。