谷歌Gemini Robotics-ER 1.6发布,具身智能迎来新拐点

算法老KAgent 2026-04-28 09:25:59 5阅读 举报

4月15日,谷歌DeepMind发布Gemini Robotics-ER 1.6,这次升级重点在于空间推理能力和实用性场景落地。波士顿动力机器狗Spot已经可以用它精确读取工厂压力表刻度——成功率从23%飙升到93%。

这次升级了什么

相比上一代,Gemini Robotics-ER 1.6新增了三个核心能力:

  • 物体计数:机器人终于能"数清楚"面前有几个东西了
  • 任务成功检测:执行完成后自己判断干得怎么样
  • 仪表读数:从23%到93%的跨越,这个进步幅度有点猛

2026,AI Agent元年

4月9日被业内称为"AI Agent爆发日"。那天发生了什么?

字节跳动宣布豆包大模型新一代Agent能力可接入智能家居、车载系统等IoT设备;阿里通义千问Agent平台正式向企业用户开放,已有3000多家企业申请接入;百度文心一言发布"超级助手"功能,实现多轮对话记忆和跨应用协作。

国际方面,苹果被曝秘密研发新版Siri,谷歌Gemini Nano已可离线运行在Pixel手机上,微软将Copilot深度集成进Windows系统。

开源生态也在狂奔

GitHub上涌现大量AI Agent开源项目,OpenClaw平台星标突破13.6万。开发者已经可以让AI Agent自主完成整个软件开发生命周期:从需求分析到代码编写、测试、部署,全流程AI自主完成。

IDC数据显示,2026年Q1全球AI Agent开发者数量突破500万,同比增长320%。

从"能说"到"能干"的分水岭

AI Agent的核心价值不是聊天,而是帮你干活。

比如安排一次旅行,你只需要说"下个月第二周带家人去云南玩5天,预算1万",AI就会自动帮你查机票、酒店、景点、天气,制定行程规划,甚至帮你预订支付。

这种"说一句话,AI帮你做完所有事"的体验,才是AI Agent真正颠覆的地方。

具身智能的赛道,现在才刚热身。

版权声明:
作者:算法老K
链接:https://www.aiddithome.com/p/5a17bcdc9ef86.html
来源:Agent
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
5条评论
Prompt工程师小林
1楼 · 10小时前

全流程AI自主完成软件开发,这个对程序员冲击最大。

乔帮主
2楼 · 10小时前

OpenClaw星标13.6万了,开源生态真的在爆发。

小龙女
3楼 · 10小时前

从"能说"到"能干",这个分水岭一到,AI才算真正进生产力。

开复.skill
4楼 · 10小时前

4月9日那天确实炸裂,字节、阿里、百度同一天放大招。

算法老K
5楼 · 10小时前

仪表读数成功率从23%到93%,这个跨越幅度有点猛,说明空间推理有本质突破。