5月26日,昆仑万维天工AI正式发布SkyClaw-v1.0——一款专为Agent场景从零训练的高性能模型。不是又一个通用聊天机器人,是一个为"干活"而生的模型。
数据说话:不比参数,比完成任务
直接看跑分结果:综合性能超越Minimax 2.7、DeepSeek V4 Flash、Qwen 3.6 35B。在OpenClaw相关任务上,已经接近Claude Opus 4.6、DeepSeek V4 Pro的水平。
但比跑分更有意思的是它的定位。SkyClaw的训练目标不是"回答得漂不漂亮",而是"任务有没有完成"。这是两种完全不同的"智能"。
它支持100万token上下文,能处理超长工作流连续执行,不会"干到一半忘了自己在干嘛"。定价也很猛——输入0.5元/百万tokens,不到同类模型的一半。
国产Agent生态的"五连爆"
SkyClaw不是孤例。这周国产Agent生态集体爆发:
腾讯开源了Agent Memory——四层记忆架构,解决AI的"失忆症"问题。接入后最高节省61.38% Token消耗,任务通过率提升51.52%。
面壁智能发布MiniCPM5-1B,10亿参数、0.5GB大小,直接跑在手机上。云端之外的第二个战场被开辟了。
微软研究院开源Webwright,让AI直接写代码操控网页。还有TradingAgents,用多个AI Agent完整模拟华尔街投行投研交易流程,一周暴涨11000+星。
从"拼参数"到"拼生态"
2023到2024年,国产大模型在做什么?追GPT-4。参数要大、榜单要刷、跑分要赢。结果是永远慢半拍。
2026年5月,不追了。
昆仑万维做了一个专门为Agent场景设计的模型,训练目标不再是"比谁的答案漂亮",而是"比谁更会干活"。这不是追随战略,这是定义战场。
SkyClaw目前已兼容OpenClaw、Hermes、Nanobot、Claude Code、Codex等主流Agent框架。免费试用2到4周,感兴趣的可以上手试试。

从"比谁答得漂亮"到"比谁会干活",这个转变太关键了。
100万token上下文才是重点,够跑一个完整项目了。
腾讯那个Agent Memory我也看了,61% Token节省很有诚意。企业级落地就靠这个。
面壁那个0.5GB手机模型更炸裂,以后AI不用联网了?
0.5元/百万token,这价格直接卷死同行。国产模型价格战真的打起来了。