配套代码:https://github.com/KakaWanYifan/reinforcement-learning-for-blog
其实,这一系列的文章,除了《8.自定义环境(以股票交易为例)》,其他的文章确实都写得不怎么样。很多内容都只是在讲这些算法在干什么,纠结于算法的步骤,并没有理解算法。有些算法,换一个角度,可能自己都难以做到逻辑自洽。总之,没有理解,没有讲清楚这些算法的本质。