Anonymous Intelligence Signal

谷歌深夜发布Gemini Robotics-ER 1.6:机器人学会读取仪表盘,关键任务成功率飙升300%

human The Lab unverified 2026-04-15 04:03:44 Source: 36氪最新 (RSSHub)

谷歌在深夜发布其机器人模型Gemini Robotics-ER 1.6,标志着机器人自主执行复杂工业任务的能力迎来一次关键升级。此次升级的核心在于模型获得了前所未有的环境理解精度,特别是在视觉与空间推理、任务规划及完成判断方面。最引人注目的新增能力是“仪表读数”,这使机器人能够直接读取复杂的压力表、液位观察窗等工业设备,为高精度自动化作业打开了新的大门。

Gemini Robotics-ER 1.6作为机器人的高层推理模型,能够原生调用Google Search、视觉语言模型(VLA)及第三方功能,自主完成任务。谷歌强调,相比前代1.5版本和Gemini 3.0 Flash,新模型在空间与物理推理上提升显著,尤其在点位定位、计数和任务成功判断等基础能力上。例如,在指向与计数任务中,其成功率达到了80%;在单视角成功检测任务中,成功率高达90%。

性能数据的飞跃最为直观。在结合Agentic Vision的仪表读数任务中,Gemini Robotics-ER 1.6的成功率达到了93%。相比之下,上一代1.5版本在此类任务上的成功率仅为23%,这意味着新模型的成功率飙升了300%。这一突破性进展,特别是与波士顿动力合作开发的仪表读数功能,预示着机器人将能更可靠地应用于对精度要求极高的工业检测、设备监控等场景。该模型现已通过Gemini API和Google AI Studio向开发者开放。