FindShine +

深度强化学习系列笔记:强化学习

2016年以来,随着AlphaGo的声名鹊起。深度学习和强化学习在学术界和工业界掀起了波澜大风,在人们探索通用人工智能的路上,他们就像黑白双煞,一个负责特征理解,一个负责找训练粮食。从去年12月起,我们团队也投入大量精力研究和学习DRL领域的技术和算法,并尝试用在电商推荐和智能投放领域。经过3个月的学习,基本建立起深度学习和强化学习的框架,我计划用2篇文章来梳理一下学习到的内容,并尝试做一些扩展。

这是第二篇文章,主要梳理强化学习的理论框架和深度强化学习的常用方法,一些具体实例待后续补充。

以下是根据David.Silver的强化学习课程《Deep Reinfocement Learning Tutorial》整理:

Basic RL

Prediction & Control

Approaches to Reinforcement Learning

Tech

Life

Project