Awosome Reinforce Learning

强化学习是近阶段研究的热点。在2022年底OpenAI发布ChatGPT后，其应用的RLHF（Reinforcement Learning from Human Feedback）引起了广泛关注；2025年初DeepSeek-R1的横空出世，进一步推动了强化学习在实际应用中的落地。本文结合笔者的个人理解与兴趣，梳理了强化学习的相关技术路线，涵盖了从基础概念到最新研究进展的各个方面。

Coming soon…