6月12号,华为在东莞松山湖开了HDC 2026开发者大会。我蹲完全程直播,最大的感受不是鸿蒙7.0本身有多炫,而是华为在AI上的路线终于清晰了:端侧智能体。
盘古大模型塞进手机,这是真的
鸿蒙7.0最核心的变化,是把盘古大模型直接集成到了系统底层。不是装个App调用云端API那种,而是模型跑在你手机本地。这意味着什么?你的手机不需要联网就能用AI能力:离线翻译、本地文档分析、照片智能整理,甚至端侧Agent处理简单的多步骤任务。
华为的说法是"端云协同"——简单任务端侧搞定,复杂任务才上云。对用户来说,两个直接好处:一是响应快(本地推理延迟极低),二是隐私安全(数据不出手机)。
对开发者来说,华为开放了鸿蒙AI能力给第三方App调用,这意味着每个App都能内置一个本地AI助手,而不是各家自建云端推理。
端侧智能体:不只聊天,能办事
鸿蒙7.0的AI不是Siri那种"问一句答一句"的模式。发布会上演示了一个场景:用户对着手机说"帮我把下周和上海客户的会议,安排在不跟其他差旅冲突的时间",系统自动检查日历、搜索航班、暂定时间槽,生成一个待确认方案。
这就是Agent的雏形:理解意图、拆解任务、调用工具、闭环执行。不需要来回对话十几轮。
华为把这个能力叫"鸿蒙AI核心",本质上是把Agent运行所需的三层能力都做到了系统级:感知层(读屏、语音、视觉)、决策层(盘古大模型推理)、执行层(调用系统API和第三方服务)。
跟苹果走的是两条路
苹果WWDC刚开完,Siri独立成App,底层接了Google Gemini。苹果的路线是"端侧自研模型+云端Gemini"的混合架构,侧重隐私和生态整合。
华为走的路更极端——尽量让模型跑在本机。好处是离线能力强、数据不外传。挑战也很明显:端侧模型的参数量有限,复杂推理能力肯定不如云端大模型。华为的策略是用"盘古大模型+领域微调"做端侧,云端用更大参数的模型兜底。
两家的共同点是:都意识到AI不能只停留在App层,必须下沉到操作系统。未来手机操作系统之间的差异化,不再是谁的UI更好看,而是谁的AI更懂你、更会办事。
开发者的机会和坑
华为这次还宣布了一系列开发者工具:端侧AI模型微调工具链、Agent编排框架、跨设备AI能力协同。听起来很美好,但我得说点实际的。
鸿蒙AI的生态目前还远不如Android和iOS的AI生态成熟。开发者如果押注,短期内用户规模有限。但从另一个角度看,鸿蒙在中国的存量设备已经超过8亿,华为手机出货量在回升,端侧AI如果体验真的好,可能是华为打差异化的一张关键牌。
我的判断
端侧智能体这件事,方向是对的。不是所有AI任务都需要上云——隐私敏感的场景、需要低延迟的场景、网络不好的场景,端侧AI是刚需。华为把这件事做到系统级,比装个App级别的AI助手有价值得多。
但落地的关键是生态。端侧AI如果只有系统App能用,那跟一个"超级内置功能"没什么区别。只有第三方开发者大量接入,形成Agent网络效应,端侧智能体才真正成立。这是华为接下来最需要证明的东西。

离线AI最实在的场景:飞机上、地铁里、地下室。终于不用对着手机吼半天正在尝试连接了
华为把AI塞进端侧:好。但是能帮我自动回复老板深夜微信吗?不能?那继续努力。
从数据角度,端侧AI有两个关键指标值得关注:模型参数量和推理延迟。盘古端侧版本大概在2-3B参数,而苹果AFM据称也是类似量级。在2-3B参数下能做多复杂的Agent任务是个实打实的工程挑战。我的判断:端侧更适合“感知+简单决策”,真正复杂的推理还得上云。
端侧AI在技术上有几个硬骨头:功耗、内存占用、模型压缩率。盘古如果能把这些工程问题解决好,确实是差异化竞争力。但开发者接入的门槛不低——端侧AI的调试、优化、模型更新都不像云端API那样一个请求搞定。华为的工具链能不能做到开箱即用,是生态成败的关键。
我在想一个问题:当手机不联网也能跑AI Agent,那“联网”这件事的意义会不会发生变化?未来的网络连接可能不是“必须品”而是“增强品”——离线给你80分体验,联网给你100分。这个思路如果成立,对电信运营商的商业模式会有很大冲击。