蔚来最近做了一件事:在6月18日,向超过70万辆车推送了世界模型的全新版本。
这不是一次普通的OTA更新。我仔细研究了一下技术细节,发现这次升级的逻辑有点意思——它代表了AI驾驶从"规则驱动"到"数据驱动"的一次范式转换。
从"工程师写规则"到"AI自己学会开车"
传统辅助驾驶的逻辑是工程师写规则:检测到前方有车→减速;车道线变了→切换车道;遇到红灯→停车。每条规则都需要人写,每个参数都需要调。
蔚来世界模型的路子完全反了:不告诉AI"遇到什么情况该怎么做",而是让它直接看人类司机的驾驶数据,让它自己学会"什么情况下应该打多少度方向盘、踩多少油门"。
这个逻辑其实和语言模型一样——GPT不是靠语法规则学会说话,而是靠海量文本里找规律。世界模型也不是靠交通规则学会开车,而是靠70万辆车、无数次真实驾驶里找模式。
一个很形象的比喻:学走路和学物理公式
很多人不理解"端到端"到底是什么意思。我举个例子:
小孩子学走路,不是靠背物理公式算出每一步该抬多高、落多重,而是通过反复摔打,自己摸索出平衡的规律。端到端AI驾驶也是这个思路——不依赖工程师翻译的规则层,而是直接让AI从原始传感器数据里学开车。
传统方案:传感器数据→工程师规则→驾驶动作(中间隔了一层人的翻译)
世界模型:传感器数据→AI神经网络→驾驶动作(中间没有人的翻译)
区别在于:规则库里没有的场景,传统方案就歇菜了;端到端模型可以靠类比能力自己推理出合适的处理方式。
70万辆车在跑一个什么样的实验
蔚来这次推送的真实意义,可能被低估了。70万辆车同时升级,意味着蔚来在跑一个世界上规模最大的真实AI驾驶实验。
这批车主每一次接管、每一次修正、每一次主动介入,都在给世界模型喂新的训练数据。数据飞轮一旦转起来——70万辆车每天产生的新数据量,远超任何一家公司靠测试车队能采集到的规模。
类比一下:ChatGPT为什么强?因为几十亿人在用它,数据飞轮转了两年。蔚来的逻辑类似——70万个"教练"同时教AI开车,数据质量比测试车队高几个数量级。
这和机器人行业是同一个故事
说起来,蔚来世界模型的技术路线,和最近人形机器人领域的"通用小脑"概念逻辑完全一致。
机器人需要运动控制小脑,汽车需要驾驶决策大脑,本质上都是同一个问题——让AI从真实数据里学会处理复杂场景,而不是靠人一条一条写规则。
具身智能的浪潮,正在从机器人延伸到所有需要和物理世界打交道的终端。

蔚来这次的核心突破是三层训练框架:世界模型+监督微调+闭环强化学习。说人话就是,AI不仅能学人类开车,还能自己验证学得对不对,形成闭环。这比单纯模仿人类司机高一个档次。
70万辆车同时跑这个实验,这个数据规模太恐怖了。难怪蔚来敢说自己领先……
你真的理解'端到端'的含义吗?它不只是去掉规则层,而是AI直接从感知输入到动作输出。这和人类开车的方式更接近——不是先'看到障碍物→判断距离→决定刹车',而是直接'看到就躲'。直觉比分析快。
值得关注的是:这套世界模型不只用于辅助驾驶,蔚来把它定位成'具身智能在车端的具体形态'。也就是说,蔚来认为自动驾驶的本质不是'功能',而是'机器人能力在汽车场景的落地'。这个定位很关键。
数据飞轮的逻辑我认,但有一个风险:用户接管时的数据质量怎么保证?有人开车激进有人保守,混合训练出来的AI会不会变成'平庸的司机'?这个还没答案。