谷歌DeepMind发布机器人高层推理模型Gemini Robotics-ER 1.6,相比前代在空间推理与多视角理解上显著提升,现已通过Gemini API和Google AI Studio开放。

核心升级能力:

  • 指向精度提升:支持精确物体检测、计数、空间关系推理与运动规划,并能正确拒绝指向不存在的物体。
  • 多视角成功检测:可综合多个摄像头画面判断任务完成状态,在遮挡或动态环境中保持准确。
  • 新增仪表读取能力:可解读圆形压力表、液位指示器及数字显示屏等工业仪表。通过视觉推理与代码执行,模型能放大细节、计算比例,并结合世界知识得出最终读数。

与Boston Dynamics的集成应用
该仪表读取能力源于与Boston Dynamics的合作。Boston Dynamics已将Gemini系列模型集成至其Orbit AIVI-Learning产品中,为所有客户上线。

  • Spot机器人:集成后,四足机器人Spot可在工业设施中自主巡检并自动读取压力表等仪表数据。
  • 性能提升:借助Gemini的推理能力,AIVI-Learning在视觉巡检、托盘计数等现有任务上的基线性能和准确率也得到提升。

模型安全性
DeepMind称ER 1.6是其“最安全的机器人模型”。在对抗性空间推理任务中,其安全指令遵从度大幅优于ER 1.5。在基于真实受伤报告的安全风险识别测试中,ER系列模型的表现也优于Gemini 3.0 Flash。


🔥 实时行情点位,群内抢先看!

进群蹲精准做单提示→青岚免费交易社群 (电报)

以上仅为青岚姐个人观点,不作为投资建议,交易需谨慎|本文由青岚加密课堂整理优化