Awosome Reinforce Learning
强化学习是近阶段研究的热点。在2022年底OpenAI发布ChatGPT后,其应用的RLHF(Reinforcement Learning from Human Feedback)引起了广泛关注;2025年初DeepSeek-R1的横空出世,进一步推动了强化学习在实际应用中的落地。本文结合笔者的个人理解与兴趣,梳理了强化学习的相关技术路线,涵盖了从基础概念到最新研究进展的各个方面。
Coming soon…
Awosome Reinforce Learning
http://zhaojingqian.github.io/2025/06/14/Awosome-Reinforce-Learning/