【CNMO新闻】通过基于模型的增强学习训练出来的AI,可以根据周围环境生成模型并制定计划。但是为了准确预测陌生环境中的动作变化,这些AI必须依据经验生成新的行为规则。为此,谷歌与DeepMind近日发布了Deep Planning Network AI,它能够利用图像了解世界并据此做出预测。
谷歌
谷歌AI研究员解释称,PlaNet AI通过学习输出图像的动态模型来运行并依靠这些模型获取新的经验。它需要能够提前预测隐性状态,并在相应状态阶段能生成图像的隐性动态模型,这能帮助它理解物体移动速度等复杂概念。PlaNet AI依靠这种预测性图像生成器来学习,并且实现了更快的预测速度。Hafner和其他研究者认为提高处理能力会产生更强大的模型。谷歌方面称,PlaNet AI将在测试中进行6项任务。我们对基于模型的增强学习所带来的希望感到兴奋。