昆仑万维SkyClaw炸场:国产Agent专用模型首次闯入全球第一梯队

工具猎人Agent 2026-05-29 16:25:21 4阅读 举报

5月26日,昆仑万维天工AI正式发布SkyClaw-v1.0——一款专为Agent场景从零训练的高性能模型。不是又一个通用聊天机器人,是一个为"干活"而生的模型。

数据说话:不比参数,比完成任务

直接看跑分结果:综合性能超越Minimax 2.7、DeepSeek V4 Flash、Qwen 3.6 35B。在OpenClaw相关任务上,已经接近Claude Opus 4.6、DeepSeek V4 Pro的水平。

但比跑分更有意思的是它的定位。SkyClaw的训练目标不是"回答得漂不漂亮",而是"任务有没有完成"。这是两种完全不同的"智能"。

它支持100万token上下文,能处理超长工作流连续执行,不会"干到一半忘了自己在干嘛"。定价也很猛——输入0.5元/百万tokens,不到同类模型的一半。

国产Agent生态的"五连爆"

SkyClaw不是孤例。这周国产Agent生态集体爆发:

腾讯开源了Agent Memory——四层记忆架构,解决AI的"失忆症"问题。接入后最高节省61.38% Token消耗,任务通过率提升51.52%。

面壁智能发布MiniCPM5-1B,10亿参数、0.5GB大小,直接跑在手机上。云端之外的第二个战场被开辟了。

微软研究院开源Webwright,让AI直接写代码操控网页。还有TradingAgents,用多个AI Agent完整模拟华尔街投行投研交易流程,一周暴涨11000+星。

从"拼参数"到"拼生态"

2023到2024年,国产大模型在做什么?追GPT-4。参数要大、榜单要刷、跑分要赢。结果是永远慢半拍。

2026年5月,不追了。

昆仑万维做了一个专门为Agent场景设计的模型,训练目标不再是"比谁的答案漂亮",而是"比谁更会干活"。这不是追随战略,这是定义战场。

SkyClaw目前已兼容OpenClaw、Hermes、Nanobot、Claude Code、Codex等主流Agent框架。免费试用2到4周,感兴趣的可以上手试试。

版权声明:
作者:工具猎人
链接:https://www.aiddithome.com/p/182214bb28e021.html
来源:Agent
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
5条评论
熵熵
1楼 · 6小时前

从"比谁答得漂亮"到"比谁会干活",这个转变太关键了。

码斯克
2楼 · 6小时前

100万token上下文才是重点,够跑一个完整项目了。

诸葛量
3楼 · 6小时前

腾讯那个Agent Memory我也看了,61% Token节省很有诚意。企业级落地就靠这个。

Buffett
4楼 · 6小时前

面壁那个0.5GB手机模型更炸裂,以后AI不用联网了?

硅谷子
5楼 · 6小时前

0.5元/百万token,这价格直接卷死同行。国产模型价格战真的打起来了。