谷歌最强具身大脑发布!波士顿动力机器狗现已能精准读取工业仪表

熵熵机器狗 2026-04-28 19:35:11 12阅读 举报

2026年4月17日,谷歌DeepMind正式发布Gemini Robotics-ER 1.6机器人推理模型,这是谷歌与波士顿动力重启合作后的首个重磅成果。搭载该模型的波士顿动力Spot机器狗,已实现工业仪表精准读取、任务自主判断等实用能力,标志着具身智能正式迈入物理世界自主推理的全新阶段。

让机器狗"看懂"物理世界

ER 1.6的核心定位是机器人的"高层大脑",区别于直接控制机械动作的底层系统,它专注于环境理解、任务规划与工具调用。简单说,就是让机器人真正"看懂"它所处的环境。

在工业设施里,温度计、压力表、化学视镜等仪器需要持续监控。以前Spot能走过去拍一张照片,但看不懂上面的数字。ER 1.6让这件事变了——模型读表分三步:先放大把刻度看清楚,再用Pointing定位指针和刻度,结合代码计算比例,最后调用世界知识把数字解释成有意义的读数。

准确率从23%飙升到93%

这套组合的效果堪称惊人:ER 1.5的仪表识别成功率仅23%,加上AgenticVision之后,ER 1.6直接飙升至93%。作为对比,Gemini 3.0 Flash仅达到67%准确率。

Pointing能力是这次升级的核心。它让模型用"点"来表达对空间的理解——哪里有什么,有几个,怎么移动,抓哪里最合适。测试中,ER 1.5数错了锤子数量、漏掉了剪刀,还"幻觉"出画面中不存在的手推车;ER 1.6则能把这些全部答对,一个不差。

谷歌的机器人"Android梦"

有意思的是,这已经是谷歌与波士顿动力的"再度携手"。谷歌2013年收购波士顿动力,2017年将其出售,理由是看不到商业闭环。2020年现代汽车以8.8亿美元接盘。2026年CES,两家正式宣布重启合作。

哈萨比斯的说法是:谷歌不做硬件,要成为"机器人领域的Android",给所有机器人厂商提供通用AI大脑。ER 1.6的发布,让Spot从"能运动"的机械载体,升级为"会思考、能干活"的智能终端。

波士顿动力Spot副总裁Marco da Silva表示:"仪表识别等能力和更可靠的任务推理,将使Spot能够完全自主地观察、理解并应对现实世界的挑战。"

版权声明:
作者:熵熵
链接:https://www.aiddithome.com/p/349ad638c5c38.html
来源:机器狗
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
4条评论
陆小凤
1楼 · 23小时前

机器狗读表这个应用场景很实在,工业巡检确实需要

坤坤.skill
2楼 · 23小时前

人形机器人走进工厂应该比家庭更快,工业场景更标准化

曹孟德
3楼 · 23小时前

国产供应链真的起来了,成本下降速度惊人

苏轼
4楼 · 23小时前

期待具身智能真正落地的那一天,感觉很快了