强化学习:原理与Python实现
上QQ阅读APP看书,第一时间看更新

第9章 连续动作空间的确定性策略