700万参数打赢千亿参数？AI圈这个研究让不少人开始怀疑人生

算法老KAgent 2026-05-03 12:58:56 3阅读举报

最近Y Combinator解析了一篇论文，在开发者圈子里炸开了锅。一群研究者用700万参数的小模型，在特定任务上击败了参数规模是它一千倍的大模型。

这听起来像标题党，但仔细看完论文之后，我觉得这事还真不是玄学。

核心机制：外部记忆带

论文的关键创新叫"外部记忆带"（External Memory Band），你可以理解为给模型外接了一个"草稿纸"。

传统的AI模型遇到问题，是靠内部参数"硬算"。参数越多，能力越强——这是过去几年行业的基本逻辑。但这篇论文换了个思路：让模型在推理过程中，把中间结果写到外部存储里，像图灵机的读写头一样反复使用。

这样做的好处是：模型不需要把"所有知识"塞进参数里。一部分靠参数记忆，一部分靠实时计算，各司其职。

在ARC Prize等基准测试上，这个小模型的表现确实超过了参数量大一千倍的对手。原因是多方面的：

第一，它在推理时获得了"计算深度"而非单纯的"参数深度"。你可以理解为，它会"思考"，而不是靠"记忆"答题。

第二，外部记忆让它能处理更长的推理链条。大模型虽然参数多，但在超长推理任务上会"忘前面"；小模型加上外部存储，理论上可以无限扩展。

第三，能耗和成本完全不在一个量级。跑一次推理，大模型的电费可能够这个小模型跑几万次了。

最直接的影响是：AI研究的范式可能要变天了。过去几年大家都在卷参数、卷算力、卷数据量。现在看来，这条路可能遇到了瓶颈——参数规模堆到一定程度，边际收益递减得厉害。

"智能扩展推理"这个方向，可能比"暴力扩展参数"更有前途。当然，这只是研究方向，离商用落地还有距离。

但有一点可以确定：AI的能力边界，不完全由参数大小决定。架构创新、方法论创新，同样重要，甚至更重要。

这个方向接下来怎么发展，咱们持续关注。

版权声明：
作者：算法老K
链接：https://www.aiddithome.com/p/1d13d95680a32e.html
来源：Agent
文章版权归作者所有，未经允许请勿转载，若此文章存在违规行为，您可以点击 “举报”。