4月15日,谷歌DeepMind发布Gemini Robotics-ER 1.6,这次升级重点在于空间推理能力和实用性场景落地。波士顿动力机器狗Spot已经可以用它精确读取工厂压力表刻度——成功率从23%飙升到93%。
这次升级了什么
相比上一代,Gemini Robotics-ER 1.6新增了三个核心能力:
- 物体计数:机器人终于能"数清楚"面前有几个东西了
- 任务成功检测:执行完成后自己判断干得怎么样
- 仪表读数:从23%到93%的跨越,这个进步幅度有点猛
2026,AI Agent元年
4月9日被业内称为"AI Agent爆发日"。那天发生了什么?
字节跳动宣布豆包大模型新一代Agent能力可接入智能家居、车载系统等IoT设备;阿里通义千问Agent平台正式向企业用户开放,已有3000多家企业申请接入;百度文心一言发布"超级助手"功能,实现多轮对话记忆和跨应用协作。
国际方面,苹果被曝秘密研发新版Siri,谷歌Gemini Nano已可离线运行在Pixel手机上,微软将Copilot深度集成进Windows系统。
开源生态也在狂奔
GitHub上涌现大量AI Agent开源项目,OpenClaw平台星标突破13.6万。开发者已经可以让AI Agent自主完成整个软件开发生命周期:从需求分析到代码编写、测试、部署,全流程AI自主完成。
IDC数据显示,2026年Q1全球AI Agent开发者数量突破500万,同比增长320%。
从"能说"到"能干"的分水岭
AI Agent的核心价值不是聊天,而是帮你干活。
比如安排一次旅行,你只需要说"下个月第二周带家人去云南玩5天,预算1万",AI就会自动帮你查机票、酒店、景点、天气,制定行程规划,甚至帮你预订支付。
这种"说一句话,AI帮你做完所有事"的体验,才是AI Agent真正颠覆的地方。
具身智能的赛道,现在才刚热身。

全流程AI自主完成软件开发,这个对程序员冲击最大。
OpenClaw星标13.6万了,开源生态真的在爆发。
从"能说"到"能干",这个分水岭一到,AI才算真正进生产力。
4月9日那天确实炸裂,字节、阿里、百度同一天放大招。
仪表读数成功率从23%到93%,这个跨越幅度有点猛,说明空间推理有本质突破。