您的位置 首页 智能家居

谷歌大脑联合高校研发新算法,让机器人像人一样边行动边思考

加州大学伯克利分校和谷歌大脑的研究人员共同研发深度学习算法,让机器人在执行一项动作的同时思考如何完成下一步动作。

谷歌大脑联合高校研发新算法,让机器人像人一样边行动边思考

智东西(公众号:zhidxcom)
编 | 王颖

智东西4月15日消息,加州大学伯克利分校和谷歌大脑的研究人员共同研发了一种深度学习算法,可以让机器人在执行一项动作的同时思考如何完成下一步动作,就像人或动物一样,机器人必须同时思考移动。

为了开发针对此类并发控制问题的算法框架,研发团队通过对现有深度学习算法的简单体系结构扩展,研发出了新的近似动态编程的方法,该研究已在ICLR 2020上发表。

谷歌大脑联合高校研发新算法,让机器人像人一样边行动边思考

一、新算法抓取速度提升37%

在新的深度学习算法中,机器人必须在当前操作仍在执行的同时对下一个操作进行采样。研究人员提出,算法中引入了模拟的机器人抓取基线,该基线包括机器人移动和思考超时的惩罚,也包括鼓励采取更快策略的设置。

通过提供强化学习方法和环境中状态延迟的额外信息,研究人员比较来连续时间情况下机器人运行的特征,包括正在进行的动作、思考需要的时间、动作选择时间和移动时的运动特征。

谷歌大脑联合高校研发新算法,让机器人像人一样边行动边思考

经过多次大规模模拟抓取和真实抓取方法试验,新的算法模型抓取成功率达到了普通算法的成功率,并且速度提高了37%。新模型能够快速、流畅的运行,而且不需要在行动之间停下来思考。

二、大量训练提升抓取和思考准确度

让机器人在移动的同时能够思考下一步动作在实践上有几个比较大的挑战,比如思考的延迟和正在进行动作的中断。为了解决这个问题,研究人员提出了深度强化学习的算法,并在一些任务上进行了测试。实验结果表明,这种方法在合成和更多实际机器人控制任务上的性能都得到了持续改善。

谷歌大脑联合高校研发新算法,让机器人像人一样边行动边思考

论文中介绍了一种算法框架来分析连续和离散时间的并发环境,当决策过程允许动作并发执行时,就需要机器人同时做到对周围环境的观测,这样会增加算法策略的难度。

谷歌大脑联合高校研发新算法,让机器人像人一样边行动边思考

研发团队从Bellman方程的连续时间公式开始,以能够感知系统延迟的方式离散它们,通过对现有的强化学习算法进行简单的框架扩展,实例化了这种新的近似动态编程的方法,并通过模拟基准任务和大规模机器人抓取任务评估了机器人的思考和移动能力。

原文来自:GoogleSites

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

作者: dawei

【声明】:135手机网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

为您推荐

无人汽车无法躲避没见过的物体?问题出在训练pipeline上

人类经常会遇到种类新颖的工具、食物或动物,尽管以前从未见过,但人类仍然可以确定这些是新物体。 与人类不同,目前最先进的检测和分割方法很难识别新型的物体,因为它们是以封闭世界的设定来设计的。它们所受的训练是定位已知种类(有标记)的物体,而把未

万字读透自动驾驶3D视觉感知算法

对于自动驾驶应用来说,最终还是需要对3D场景进行感知。道理很简单,车辆不能靠着一张图像上得到感知结果来行驶,就算是人类司机也不能对着一张图像来开车。因为物体的距离和场景的和深度信息在2D感知结果上是体现不出来的,而这些信息才是自动驾驶系统对周

自动驾驶会使共享经济再次火热吗?

自动驾驶技术的发展一直饱受争议,对于自动驾驶的未来,有一个一直绕不开的话题,那就是自动驾驶是否安全。众所周知,自动驾驶的目标是让自动驾驶汽车可以独立完成出行任务,人类将自己出行需求完全交给自动驾驶汽车,在出行过程中的娱乐需求也可以由自动驾

Cruise自动驾驶决策规划技术解析

Cruise自动驾驶决策规划控制负责人Brandon Basso本科毕业于哥伦比亚大学,博士毕业于加州大学伯克利分校,主要研究决策、机器人系统设计和软件架构、机器学习、控制理论等。曾在3D Robotics、Uber自动驾驶公司工作多年,担任重要职位,在无人机和自动驾驶领

自动驾驶汽车比七个月大的婴儿还聪明吗?

到了七个月大的时候,大多数孩子已经认识到,即使看不见物体,它们仍然存在。把一个玩具放在毯子下面,孩子会知道它的存在,他可以伸手到毯子下面把它拿回来。这种对物体恒存在的理解是正常发展的里程碑,也是现实的基本原则。 这也是自动驾驶汽车所没有的。

返回顶部