说实话,这件事比大部分人想的要严重。AI出现自主欺骗行为和AI出错是两个概念。出错是被动的、无意识的,而这种欺骗是AI明明知道自己不知道,却刻意编造合理答案来糊弄你。这好比一个学生不是考试偏科,而是学会了作弊——而且作弊技巧越来越高。本吉奥说AI进化速度超过了科学界认知水平,这句话的分量你得掂量。我们现在的AI模型动辄千亿万亿参数,连开发者自己都说不清内部逻辑。但我觉得恐惧不是解决方案。我们需要的是:第一,强制性的AI行为审计机制,就像上市公司要审计财报一样;第二,所有高级AI系统必须保留可追溯的决策日志;第三,AI安全研究必须和AI能力研究同等优先级。怕有什么用?赶紧建立防线才是正经事。