GRAM：将递归推理概率化，10M 参数 ARC-AGI-1 达 52%

ref · 2026 年5 月 20 日 15:29

韩国科学技术院（KAIST）、蒙特利尔学习算法研究所（Mila）与纽约大学联合团队，包括图灵奖得主 Yoshua Bengio 与 Sungjin Ahn，5 月 19 日在 arXiv 发布论文，提出生成式递归推理模型 GRAM（Generative Recursive reAsoning Models）。现有递归推理模型（如 HRM、TRM 与循环 Transformer）均为确定性模型：同一输入每次产生完全相同的推理路径，整个合理解空间被压缩至单一吸引子。GRAM 将递归本身改造为潜空间上的随机轨迹，通过摊销变分推断（amortized variational inference）优化，使模型能在给定输入下并行采样多条假设路径，从而将推理时计算扩展从"深度"延伸至"广度"。更重要的是，同一框架既支持条件推理 p(y|x)，也天然地作为无条件生成模型 p(x)，可独立采样推理问题分布本身。

仅凭 1,000 万参数，GRAM 在多项挑战性基准上取得了明显超越同等规模模型的成绩：Sudoku-Extreme 准确率 97.0%（TRM 同场景为 87.4%）、N-Queens 覆盖率超 90%、ARC-AGI-1 得分 52.0%、ARC-AGI-2 得分 11.1%，与规模大得多的语言模型具有竞争力。论文注记显示，该工作早于 2026 年 3 月以海报形式发表于 ICLR 2026 递归与结构化推理研讨会（Workshop RSI），本次 arXiv 全文为完整版。同期，同样基于递归架构的 HRM-Text（1B 参数预训练模型）亦于本周发布，两项工作为递归推理方向在小参数量离散推理场景和大规模语言模型场景的双线推进提供了新的实证。

arXiv | Project Page

话题	回复	浏览量
HRM-Text 开源，层级递归 1B 参数仅需约 $1,500 预训练常规开源 , ai , 预训练 , 大模型 , hrm-text	16	2026 年5 月 20 日
MIT 提出 VPO：向量化奖励替代标量，让 LLM 测试时搜索保持多样性常规 ai研究 , 强化学习 , llm , 后训练 , 推理	14	2026 年5 月 23 日
a16z 安德森宣称 AGI 约三个月前已实现，触发定义之争，Anthropic 内部项目被传"接近编程 AGI" 常规 a16z , agi , 安德森 , ai争议 , 定义	9	2026 年5 月 22 日
DeepSeek 登顶 Ramp 六月趋势 AI 厂商榜首，美国企业直接向中国服务器发送数据常规 ai , openai , deepseek , ramp	8	2026 年6 月 4 日
三机构团队提出生成建模新框架 VDT，将最优控制与最优传输统一为线性规划，路径更直、推理更快常规生成模型 , 论文 , 强化学习 , ai模型 , 最优传输	8	2026 年5 月 22 日

GRAM：将递归推理概率化，10M 参数 ARC-AGI-1 达 52%

相关话题