强化学习导论
latest
第二版前言
第一版前言
符号一览
第1章 简介
第一部分 表格解决方法
第二部分 近似解决方法
第三部分 深入研究
第14章 心理学
第15章 神经科学
第16章 应用及案例分析
第17章 前沿技术
参考文献
强化学习导论
第三部分 深入研究
Edit on GitHub
第三部分 深入研究
本书的最后一部分超出了前两部分提出的标准强化学习思想的范畴。 该部分简要地介绍了它们与心理学和神经科学的关系、强化学习应用的一些案例,以及未来强化学习研究的一些前沿领域。
第14章 心理学
14.1 预测与控制
14.2 经典条件反射
第15章 神经科学
15.1 神经科学基础
15.2 收益信号、强化信号、价值和预测误差
15.3 收益预测误差假说
15.4 多巴胺
15.5 收益预测误差假说的实验支持
15.6 TD误差/多巴胺对应
15.7 神经“行动器-评判器”
15.8 行动器与评判器学习规则
15.9 享乐主义神经元
15.10 集体强化学习
15.11 大脑中的基于模型的算法
15.12 成瘾
15.13 本章小结
参考文献和历史评注
第16章 应用及案例分析
第17章 前沿技术