Awosome Reinforce Learning

强化学习是近阶段研究的热点。在2022年底OpenAI发布ChatGPT后,其应用的RLHF(Reinforcement Learning from Human Feedback)引起了广泛关注;2025年初DeepSeek-R1的横空出世,进一步推动了强化学习在实际应用中的落地。本文结合笔者的个人理解与兴趣,梳理了强化学习的相关技术路线,涵盖了从基础概念到最新研究进展的各个方面。

Coming soon…


Awosome Reinforce Learning
http://zhaojingqian.github.io/2025/06/14/Awosome-Reinforce-Learning/
作者
Zhao Jingqian
发布于
2025年6月14日
更新于
2025年6月14日
许可协议