第二部分　常用算法篇

4　DQN算法

深度Q网络（Deep Q-Network，DQN）作为深度强化学习的代表算法之一，对于强化学习在复杂任务上的应用有里程碑式的意义。它由DeepMind 2013年发表于机器学习的顶级会议“神经信息处理系统大会”（Conference on Neural Information Processing Systems，NeurIPS）上，第一次将深度学习与强化学习有机结合，使得计算机能够在Atari 2600型的游戏机上，通过端到端的训练就达到可与人媲美的水平。2015年，经过改进和完善后，DQN登上了富有盛名的科学杂志《自然》（Nature）的封面，这一次，它在49种不同的Atari游戏中都有不俗的表现，并且其中一半能够超过人类的顶尖水平。这使得DQN成为当时通用人工智能的一个标志性研究工作［44，46，69，55，75］。

虽然距离第一个DQN的提出已经有7年了，在此期间有很多性能更好的深度强化学习算法被提出，但DQN由于自身的一些特点，生命力依然旺盛，不仅衍生出了诸多变种和改进版本，而且大量应用在实践中。

本章将详细介绍DQN的算法细节、DQN的改进算法和DQN的应用。

第二部分 常用算法篇

4 DQN算法

第二部分　常用算法篇

4　DQN算法