网友斯坦福团队新作义务成功率暴增喊话就能指点机器人特斯拉搞快点

2024-11-15

斯坦福的ALOHA家务机器人团队，发布了最新钻研成绩——

名目名为Yell At Your Robot（简称YAY），有了它，机器人的“翻车”举措，只需喊句话就能纠正了！

而且机器人可以随着人类的喊话灵活优化举措水平、即时调整战略，并依据反应继续自我改良。

比如在这个场景中，机器人没能成功系统设定的“把海绵放入袋子”的义务。

这时钻研者间接朝它喊话，“用海绵把袋子撑得再开一些”，之后就一下子成功了。

而且，这些纠正的指令还会被系统记载上去，成为训练数据，用于进一步提高机器人的后续体现。

有网友看了说，既然曾经能朝着机器人喊话了，那汽车是不是也快点布置上，还在线点名特斯拉和其智能驾驶软件总监Ashok Elluswamy。

成绩发布后，前谷歌机器人初级钻研员Eric Jang，前DeepMind钻研员、斯坦福客座传授Karol Hausman等一众大佬也纷繁示意了必需和称许。

那么，用喊话调整的机器人，都能成功什么样的举措呢？

喊话就能颐指气使

应用YAY技术调教后，机器人以更高的成功率应战了东西装袋、水果混合和洗盘子这三项复杂义务。

这三种义务的特点是都须要两只手区分成功不同的举措，其中一只手要稳固地拿住容器并依据须要调整姿态，另一只手则须要准确定位指标位置并成功指令，而且环节中还触及海绵这种软性物体，拿捏的力度也是一门学识。

以打包装袋这个义务为例，机器人在全自主行动的环节中会遇到各种各样的艰巨，但经过喊话就能见招拆招。

只见机器人在将装袋的环节中不小心把海绵掉落了上去，而后便不可再次捡起。

这时，开发者间接朝它喊话，口令就是便捷的“往我这边挪一挪，而后往左”。

当依照指令做出举措后，第一次性还是没成功，但机器人记住了“往左”这个指令，再次左移之后便成功把海绵捡起来了。

但紧接着就发生了新的艰巨——袋子的口被卡住了。

这时只需通知它再把袋子关上一点点，机器人就“心照不宣”，调整出了一系列后续举措，并最终成功成功义务。

而且不仅是能纠正失误，义务的细节也能经过喊话实时调整，比如在装糖的义务中，开发者感觉机器人拿的糖有点多了，只需喊出“少一点”，机器人就会将一局部糖果倒回盒子。

进一步地，人类收回的这些指令还会被系统记载并用作微调，以提高机器人的后续体现。

比如在刷盘子这项义务中，经过微调之后的机器人清洁力度更强，范围也变大了。

统计数据标明，机器人在教训这种微调之后，平均义务成功率提高了20%，假设继续添加喊话指令还能继续提高。

而且这样的指令-微调环节可以迭代启动，每迭代一次性机器人的体现都能有所优化。

那么，YAY详细是如何成功的呢？

人类教诲“铭刻在心”

架构上，整个YAY系统关键由初级战略和低级战略这两个局部组成。

其中初级战略担任生成指点低级战略的言语指令，低级战略则用于行动详细举措。

详细来说，初级战略将摄像头捕捉到的视觉消息编码，与关系常识结合，而后由Transformer生成蕴含举措形容、未来举措预测等外容的指令。

而低级战略接纳到言语指令后，会解析这些指令中的关键词，并映射到机器人关节的指标位置或静止轨迹。

同时，YAY系统引入了实时的言语纠正机制，人类的行动命令优先级最高——经识别后，间接传递给低级战略用于行动。

且在这个环节中命令会被系统记载并用于微调初级战略——经过学习人类提供的纠正性反应，逐渐缩小对即时行动纠正的依赖，从而提高常年义务的自主成功率。

在成功基础训练并曾经在实在环境中部署后，系统依然可以继续搜集指令消息，始终地从反应中学习并启动自我改良。

作者简介

本名目的第一作者是斯坦福大学的在校生钻研员Lucy X. Shi，2019年毕业于人大附中后进入南加州大学就读计算机迷信专业。

其间，Lucy曾到英伟达实习钻研多模态大模型，并曾与出名AI学者Jim Fan博士协作。

她的论文曾延续两年被机器人顶会CoRL收录，还中选过NeurIPS，自己还被DeepMind约请宣布过演讲。

Lucy的导师Chelsea Finn是斯坦福计算机迷信和电气工程系助理传授，谷歌学术论文援用数超4.7万，此前还在Google Brain上班过一段期间。

包括本名目在内，在ALOHA团队宣布的一系列论文当中，Finn总是作为通信作者发生。

此外，ALOHA团队的Tony Z. Zhao、Sergey Levine等钻研人员，也是本文的独特作者。

论文地址：

义务机器人特斯拉

<<达成分歧多云时代的存储战略直面复杂

农业反派农作物收割机器人在环球市场的崛起>>

网友 斯坦福团队新作 义务成功率暴增 喊话就能指点机器人 特斯拉搞快点

喊话就能颐指气使

人类教诲“铭刻在心”

作者简介

您可能还会对下面的文章感兴趣：

随便看看

网友斯坦福团队新作义务成功率暴增喊话就能指点机器人特斯拉搞快点