四海资讯
首页 > 科技资讯 > 手机数码

Nvidia研究人员可以训练机器人拾取东西

时间:2018-10-30

据外媒报道,来自Nvidia的研究人员已经攻克了一段时间来应对这一挑战,但是训练这些算法仍然很困难。 本周在苏黎世的机器人学习会议上,一支由Nvidia研究人员组成的研究小组展示了一种可以提供解决方案的新型深度学习系统。

Nvidia研究人员可以训练机器人拾取东西(图片来自网络)Nvidia研究人员可以训练机器人拾取东西(图片来自网络)

通过使用合成图像训练计算机视觉算法,该团队设法绕过了复杂的,劳动量密集的准备摄影图像训练的过程。 最重要的是,通过特定的合成图像组合,Nvidia团队已经训练了一种算法,通过在标准基准的若干对象上进行对象姿态估计,第一次仅用合成数据训练的算法击败了在网络上对真实图像进行训练。 这将使机器人的训练算法更容易。

Nvidia的首席机器人研究员Stan Birchfield向ZDNet解释说:“使用合成数据,我们可以生成几乎无限量的标签,而且基本上是免费的。”

“最终,我们要做的就是让一个人在短时间内教会一个机器人完成一项新任务,” Birchfield说。 这将扩大机器人在各种环境中帮助人们的可能性,包括工厂,家庭或医疗保健机构。

计算机视觉研究的困难和复杂性,决定了在这个领域还需要做更多的工作。 虽然研究人员在这一领域取得了重大进展,但他们还需针对固定数据集测试他们的算法。 “而这种方法并不能100%转化为现实世界环境和机器人系统所需计算数据,”Birchfield说,“我们向人们展示了一个系统,不仅可以在特定数据集上展示出良好的定量结果,而且还可以在机器人系统的环境中运行。”

Nvidia团队会将标准RGB摄像机安装到机器人上,并通过该算法使机器人能够查看,拾取和移动图像。

研究人员使用Nvidia Tesla V100 GPU在DGX站上训练网络,使用cuDNN加速的深度PyTorch。 他们使用Nvidia开发的自定义插件为虚幻引擎生成合成数据。

过去,合成数据不足以用于训练计算机视觉算法,因为计算机生成的图像看起来并不真实。

“直到最近,大约一年左右,可以尝试制作看起来越来越逼真的图像,”Birchfield解释道。 “研究人员发现的问题是,为了使图像更逼真,他们不得不雇用艺术家,并且不得不花费大量时间来制作场景,使其看起来与现实世界完全一样。这减少了变化的数量。 你可以模拟一个特定的 房间,但不能包含所有房间。”

  • 上一篇:消费升级 慧辰资讯/京东发布最新趋势报告
  • 下一篇:iOS 12.1推送 双SIM卡支持/emoji新表情