【CNMO新闻】麻省理工学院和微软研究人员开发出了一种新的模型,并通过该模型证明了自动驾驶系统在训练样本中的情况和现实世界中实际发生的情况是不符的。因此工程师可以使用该模型来提高无人驾驶车辆和自动化机器人的安全性。
自动驾驶车辆
研究人员通过模拟训练来设置人工智能系统。但是,当其在现实世界中行动时,可能会因为人类对其密切监视的行为,致使它在系统中出现错误时提供反馈。人类可以通过多种方式提供数据,例如通过示范和校正。在编译了反馈数据之后,系统就会有一个情况列表,并且对于每种情况都会有多个标签来对其进行说明。然后,研究人员会将训练数据和人类反馈数据结合在一起,并使用机器学习技术生成一个模型,该模型可以精确定位人工智能系统最需要的信息,以便正确行动。研究人员使用视频游戏验证了他们的方法,利用模拟人校正了屏幕角色的学习路径。
论文作者表示,这个模型帮助自动化系统更好地了解了许多对他们来说未知的领域。他们想以一种安全的方式弥合虚拟和现实世界之间的差距。当系统部署到现实世界中时,它可以使用这种学习模型更加准确地行动。如果学习模型预测状态高概率是一个盲点,系统就可以向人类询问可接受的动作,从而让执行变得更加安全。