深度强化学习核心算法与应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二部分 常用算法篇

4 DQN算法

深度Q网络(Deep Q-Network,DQN)作为深度强化学习的代表算法之一,对于强化学习在复杂任务上的应用有里程碑式的意义。它由DeepMind 2013年发表于机器学习的顶级会议“神经信息处理系统大会”(Conference on Neural Information Processing Systems,NeurIPS)上,第一次将深度学习与强化学习有机结合,使得计算机能够在Atari 2600型的游戏机上,通过端到端的训练就达到可与人媲美的水平。2015年,经过改进和完善后,DQN登上了富有盛名的科学杂志《自然》(Nature)的封面,这一次,它在49种不同的Atari游戏中都有不俗的表现,并且其中一半能够超过人类的顶尖水平。这使得DQN成为当时通用人工智能的一个标志性研究工作[44,46,69,55,75]

虽然距离第一个DQN的提出已经有7年了,在此期间有很多性能更好的深度强化学习算法被提出,但DQN由于自身的一些特点,生命力依然旺盛,不仅衍生出了诸多变种和改进版本,而且大量应用在实践中。

本章将详细介绍DQN的算法细节、DQN的改进算法和DQN的应用。