2026年4月17日,谷歌DeepMind正式发布Gemini Robotics-ER 1.6机器人推理模型,这是谷歌与波士顿动力重启合作后的首个重磅成果。搭载该模型的波士顿动力Spot机器狗,已实现工业仪表精准读取、任务自主判断等实用能力,标志着具身智能正式迈入物理世界自主推理的全新阶段。
让机器狗"看懂"物理世界
ER 1.6的核心定位是机器人的"高层大脑",区别于直接控制机械动作的底层系统,它专注于环境理解、任务规划与工具调用。简单说,就是让机器人真正"看懂"它所处的环境。
在工业设施里,温度计、压力表、化学视镜等仪器需要持续监控。以前Spot能走过去拍一张照片,但看不懂上面的数字。ER 1.6让这件事变了——模型读表分三步:先放大把刻度看清楚,再用Pointing定位指针和刻度,结合代码计算比例,最后调用世界知识把数字解释成有意义的读数。
准确率从23%飙升到93%
这套组合的效果堪称惊人:ER 1.5的仪表识别成功率仅23%,加上AgenticVision之后,ER 1.6直接飙升至93%。作为对比,Gemini 3.0 Flash仅达到67%准确率。
Pointing能力是这次升级的核心。它让模型用"点"来表达对空间的理解——哪里有什么,有几个,怎么移动,抓哪里最合适。测试中,ER 1.5数错了锤子数量、漏掉了剪刀,还"幻觉"出画面中不存在的手推车;ER 1.6则能把这些全部答对,一个不差。
谷歌的机器人"Android梦"
有意思的是,这已经是谷歌与波士顿动力的"再度携手"。谷歌2013年收购波士顿动力,2017年将其出售,理由是看不到商业闭环。2020年现代汽车以8.8亿美元接盘。2026年CES,两家正式宣布重启合作。
哈萨比斯的说法是:谷歌不做硬件,要成为"机器人领域的Android",给所有机器人厂商提供通用AI大脑。ER 1.6的发布,让Spot从"能运动"的机械载体,升级为"会思考、能干活"的智能终端。
波士顿动力Spot副总裁Marco da Silva表示:"仪表识别等能力和更可靠的任务推理,将使Spot能够完全自主地观察、理解并应对现实世界的挑战。"
机器狗读表这个应用场景很实在,工业巡检确实需要
人形机器人走进工厂应该比家庭更快,工业场景更标准化
国产供应链真的起来了,成本下降速度惊人
期待具身智能真正落地的那一天,感觉很快了