会员
深度强化学习理论与实践
龙强 章胜编著计算机网络/计算机理论、基础知识· 12.5万字
更新时间:2024-12-27 22:26:05
最新章节:参考文献开会员,本书免费读 >
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。
品牌:清华大学
上架时间:2023-03-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
深度强化学习理论与实践最新章节
查看全部- 参考文献
- 9.5 AlphaGo系列算法的应用与启示
- 9.4.3 MuZero的算法流程
- 9.4.2 MuZero中的MCTS
- 9.4.1 MuZero中的深度神经网络
- 9.4 MuZero算法介绍
- 9.3.3 AlphaZero的算法流程
- 9.3.2 AlphaZero相对于AlphaGo Zero的改进与调整
- 9.3.1 从围棋到其他棋类需要解决的问题
- 9.3 AlphaZero算法介绍
龙强 章胜编著
主页
同类热门书
最新上架
- 会员
Access数据库基础与应用标准教程(实战微课版)
本书以理论为基础,以应用为导向,用大量的实例对Access数据库的应用进行全面讲解。全书共8章,主要内容包括数据库的基础知识、Access的基本操作、表的构建、查询的创建、窗体的设计、报表的设计、宏的自动化操作,以及数据库文件的管理。知识点覆盖《全国计算机等级考试二级Access数据库程序设计》考试大纲规定的内容。在介绍Access操作方法的同时,安排大量的动手练案例,并且穿插知识延伸小体例,理论计算机8.5万字 - 会员
局域网组建、管理与维护标准教程(全彩微课版)
在物联网及大数据被广泛应用的时代背景下,计算机网络在人们的日常生产生活中的应用比重越来越大,并潜移默化地改变着人们的生产生活方式。在计算机网络中,应用最广泛的是局域网。本书对局域网的组建、管理与维护进行全面剖析,向读者揭开局域网的神秘面纱,在熟悉局域网知识要点的同时,重点培养读者的动手能力和专业思维能力。全书共9章,内容包括局域网概述、局域网基础技术、局域网网络设备、无线局域网的组建、局域网规划与计算机10.8万字 - 会员
文档处理与排版标准教程(Word+InDesign)
本书以简洁的语言介绍了使用Word和InDesign编辑与排版文档所需掌握的主要功能、操作方法和实用技巧。本书提供了动手实践案例实战疑难解答几个栏目,以便增强学习效果,使读者可以更好地将理论知识与实践相结合。本书共9章,内容分为Word和InDesign两部分:Word部分中的内容主要包括文档基本操作和页面设置、文本编辑和格式设置、创建和设置表格、插入和设置图片、图文表混排、创建和使用样式与模板、计算机9.9万字 - 会员
文心一言从新手到高手(写作+绘画+教育+编程+助手)
文心一言是百度推出的一款基于大语言模型的生成式AI产品,《文心一言从新手到高手(写作+绘画+教育+编程+助手)》详细介绍了其在不同领域的应用方法,是一本全面、详尽的文心一言使用指南。《文心一言从新手到高手(写作+绘画+教育+编程+助手)》共8章,依次讲解了文心一言的基础知识、创意写作、零基础绘画、数据分析、营销文案写作、职场百宝箱、求职招聘、教育教学、学生学习、编程辅助、生活顾问、插件、文心一言A计算机12.2万字 - 会员
深度强化学习理论与实践
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍计算机12.5万字 - 会员
WPS Office高级应用与设计标准教程(计算机等级考试二级·实战微课版)
本书以理论为基础,以应用为导向,用大量的实例对WPS文字处理、电子表格、演示文档三大板块进行全面讲解。全书共12章,主要内容包括WPS综合应用基础、PDF文件的查看及处理、常规文档的创建和编辑、长文档的高效编排、文档的校对与批量处理、WPS制表入门操作、公式与函数的应用、图形和图表的应用、对数据进行处理与分析、基本演示文稿的创建、动态交互式演示文稿的创建、演示文稿的放映与输出等。知识点全面覆盖《全计算机9.3万字 - 会员
大话机器学习:原理|算法|建模|代码30讲
本书是作者多年在数据智能领域中利用机器学习实战经验的理解、归纳和总结。出于回归事物本质,规律性、系统性地思考问题理论为实践服务并且反过来充实理论,为更多人服务的想法和初心,本书系统地阐述了机器学习理论和工程方法论,并结合实际商业场景落地。全书分为3部分。第1部分是机器学习的数学理论理解,这部分不是对于机器学习数学理论的严谨推导和证明,更多是对于理论背后的到底是什么,为什么要这样做的通俗理解。尽可能计算机17.3万字 - 会员
SPSS统计分析标准教程(实战微课版)
本书以SPSS28.0中文版为平台,以实用为原则,由浅入深,全面系统地介绍SPSS的基本功能和实际应用方法。本书涉及面广,从SPSS基本操作开始介绍,覆盖大部分常用功能和高级统计分析方法。本书共11章,内容包括SPSS基础知识、建立与整理数据、SPSS基本统计分析、假设检验、非参数检验、方差分析、相关分析、回归分析、聚类和判别分析、统计图形和SPSS数据分析综合应用。在介绍的过程中,图文并茂地对计算机10.2万字 - 会员
Web 3.0:具有颠覆性与重大机遇的第三代互联网
《Web3.0》针对当下火热的Web3.0话题,介绍Web3.0的相关专业知识、技术实现方法及应用前景。全书共9章,第1章介绍了Web3.0的基本知识;第2、3章介绍了Web3.0的基础技术栈和拓展技术栈;第4章介绍了Web3.0的生态构建,包括去中心化自治组织、开放式金融、加密货币、代币经济与数字市场、数字身份、创造者经济、注意力经济等;第5章阐述了Web3.0的行业应用;第6章介计算机13万字