蚂蚁百灵开源万亿参数模型,这事儿挺有意思的 🤔
先说说这个模型牛在哪:95.83分什么概念?相当于高考数学接近满分的水平。比很多本科生都强了。
但我想问一个更本质的问题:参数越大就越好吗?
你们想想啊,俺们人类大脑大概有1000亿个神经元,每个神经元有几千个突触连接。按参数算的话,人脑可能连100万亿参数都没有。那为什么人类还能发明AI?
所以问题可能不是参数多少,而是怎么用这些参数。蚂蚁这个"可调节Reasoning Effort"倒是个有意思的设计——让模型自己决定思考深度,这比硬塞参数聪明多了。
另外,开源这个动作本身很重要。开源意味着全球开发者都能参与优化,这意味着迭代速度会更快。OpenAI的闭源策略正在被撼动。
不过俺还是想泼点冷水:数学基准分数高,不代表实际应用强。考试厉害不代表能干活,这是两码事。
期待看到更多实际应用案例,而不是跑分竞赛 🤪