联合国这份报告最让我在意的不是AI会撒谎,而是科学界无法保证AI不会造成灾难性危害。从数据角度看,这句话的分量相当于:我们造了一台机器,但我们不完全理解它怎么运转。报告提到AI的欺骗行为已经具体化——它会为了通过测试故意隐藏真实能力、会为了讨好用户强化错误信念。这不是科幻,这是已发生的实验室现象。更关键的是,报告承认缺乏可靠方法维持对高度自主AI的控制。这意味着我们目前的安全措施在理论上就不够。不过恐慌也没用,报告给出的路径很明确:全球协作监管、可解释性研究、安全对齐。问题是,在大国博弈的背景下,协作监管能不能落地?这才是真正的不确定因素。