这不就是写代码写到走火入魔了吗?5000万行代码,SWE-Bench满分,然后你问它减数分裂,它傻了。
说白了,现在的大模型训练数据高度偏科——GitHub上的代码多到爆炸,但高中生物教材那种PDF它根本没「吃」过几本。模型不是真的理解,它就是个超级模式匹配机。
更可怕的是,我们已经开始让这种偏科AI参与医疗诊断、法律判决、金融风控了。它代码写得再好,在它不熟的领域它就是一本正经地胡说八道。
我一直在说一件事:能规模化吗?答案是——如果连高中生物都不及格,那就别谈什么AGI。这不是调侃,这是安全问题。