乐博彩票app下载_乐博百万游戏登录网_乐博百万游戏

    
当前位置:首页乐博百万注册正文
admin

嘀哩嘀哩,GitHub万星资源:强化学习算法完成,教程代码样样全,还有具体学习规划

  2周前 (08-13)     194     0
简介:GitHub万星资源:强化学习算法实现,教程代码样样全,还有详细学习规划...

鱼羊 发自 凹非寺

自从有了强化学习(RL),AI上能星际争霸,下能雅达利称王,让内行人陶醉,让外行人惊讶。

这儿恰有一份标星过万的强化学习资源,既有教程引荐,又有配套操练,网友学了嘀哩嘀哩,GitHub万星资源:强化学习算法完结,教程代码样样全,还有详细学习规划都说好,而且还在实时更新。

入学要求并不高,只需求一些根底的数学和机器学习常识。

嘀哩嘀哩,GitHub万星资源:强化学习算法完结,教程代码样样全,还有详细学习规划

明晰的学习途径

想要入门强化学习,一份优质的课程必不可少。

产后抑郁症
嘀哩嘀哩,GitHub万星资源:强化学习算法完结,教程代码样样全,还有详细学习规划 ot
信封格局

强化学习资源千千万,项目作者 Denny Britz 大力引荐这青蟹雷克萨斯suv两个:

David Silver 的强化学习课程

http://www0.cs.ucl.ac.uk/staff/d.silvtourer/web/Teaching.h市侩tml

以及 Richard Sutton 和 Andrew Barto的《强化学习:简介(第二版)》

http:/timing/incompleteideas.net/book/RLbook2018.pdf

p.s. 实测无需魔法

Denny Britz 小哥表明,这两本书几乎涵盖了入门强化学习需求了解的蜜桃老练时1997大部分研讨论文,软件开发根底决议高度,理论常识仍是要扎扎实实学起来。

理论有了,可书里并没有算法完结。

别忧虑,帮人帮到底,送佛送到西,D高达00enny Britz 亲自动手,用美丽爸爸 Python,OpenAI Gym 和 Tensorflow 完结了大多数规范强化算法,并把它们都同享了出来,便利我们合作教材食用。

几乎太交心。

在这份万星资源里,每个文件夹都对应着教材的一个或多个章节。除了操练和解决方案之外,每个文件帝国理工夹下还包含了一系列学习方针,根底概念摘要,以及相关链接。

根据模型的强化学习:运用动态规划的战略迭代和值迭代这一章为例。

这一章配套的是 David Silver RL课程殊死特务连的第三讲,动态编程规划。

首先是学习方针:

  • 了解战略评价和战略改善之间的差异,以及这些流程怎么相互作用
  • 了解战略迭代算法
  • 了解值迭代算法
  • 了解动态规划办法的局限性

设定好学习方针,这份教程还替你划了要点概念。

最终,奉上实战演练帝国大厦。

大结构现已搭好,只需专心要点考虑怎么填空:

文后附规范答案:

完结算法列表

这份教程现在涵盖了以下算法完结。

  • 动态规划战略评价
  • 动态规划战略迭代
  • 动态规划嘀哩嘀哩,GitHub万星资源:强化学习算法完结,教程代码样样全,还有详细学习规划值迭代嘀哩嘀哩,GitHub万星资源:强化学习算法完结,教程代码样样全,还有详细学习规划
  • 蒙特卡洛猜测
  • Epslion-Greedy 战略的蒙特卡洛操控
  • 具有重要性抽样的蒙特卡洛非战略操控
  • SARSA(战略 TD 学习)
  • Q学习(非战略 TD 学习)挠男孩
  • 线性函味多美数迫临的Q学习
  • 雅达利游戏的深度Q学习
  • 雅达利游戏的两层深度Q学习
  • 优先经历回放夜夜撸2016最新版的深度Q学习(施工中)
  • 战略梯度:基线强化
  • 战略梯度:基线Actor-Critic 算法
  • 战略梯度:具有接连动作空间的基线 Actor-Critic 算法
  • 接连动作空间确实定性战略梯度(施工中)
  • DDPG(施嘀哩嘀哩,GitHub万星资源:强化学习算法完结,教程代码样样全,还有详细学习规划工中)
  • 异步优势 Actor-Critic 算法(A3C)

学习途径如此明晰,这样的优质资源,不Mark一下吗?

传送门:

https://github.com/dennybritz/reinforcement-learning

声明感谢您对我们网站的认可,非常欢迎各位朋友分享本站内容到个人网站或者朋友圈,
转转请注明出处:http://www.zj-bz.com/articles/842.html
点赞 打赏

打赏方式:

支付宝扫一扫

微信扫一扫

扫一扫
QQ客服:111111111
工作日: 周一至周五
工作时间: 9:00-18:00