您当前的位置:首页 > 电脑百科 > 人工智能

学习强化学习之前需要掌握的3种技能

时间:2020-07-19 11:29:14  来源:  作者:

 

学习强化学习之前需要掌握的3种技能

 

1.监督学习

现代强化学习几乎完全集中在深度强化学习上。深度强化学习中的“深”一词意味着在算法的核心方面使用神经网络。神经网络在学习过程中进行一些高维近似。话虽如此,该模型并不需要具有许多层和特征,这是一个普遍的误解,深层暗示了许多层。

几乎所有的课程和教程都假定你可以微调简单的神经网络以近似状态值或创建最终策略。从历史上看,这些模型对以下所有训练参数高度敏感:学习率,批量大小,模型参数,数据规范化等等。RL学习中有许多问题,最好的方法是学习监督学习,然后让AutoML工具为你完成工作。

从学习一些代码开始,理解代码所有内容,然后重新构建。这样做几次,你会学的很好。监督学习也是一项技能,在接下来的十年中,它将转化为计算机科学的大多数领域,因此请紧跟其后。

学习强化学习之前需要掌握的3种技能

 

2.人工智能中的搜索方法

RL是策略空间中的一个搜索问题。近年来影响最大的论文都是从古老的搜索问题中得到了严重的启发。让我们来看看最近在RL最有影响力的三篇论文:

  1. 迄今为止最主流的强化学习结果是:Deepmind掌握了许多游戏,并进行了大规模强化学习。最近是利用规划网络来探索的未来行动(https://deepmind.com/research/publications/investigation-model-free-planning)
  2. 基于模型的RL的研究现状:基于模型的策略优化(MBPO)。MBPO正在状态作用空间的附近区域进行搜索,以获得更完整的知识。这种模拟的知识就像是一种简单的探索。(https://arxiv.org/abs/1906.08253)
  3. 无模型的RL研究现状:Soft Actor-critic (SAC)。SAC以有效勘探和高峰值性能相结合而闻名。它通过最大化策略上的熵项来实现这一点。作为一个搜索问题,直接策略搜索是RL最关键的方面。

你可以在加州大学伯克利分校和麻省理工学院的人工智能课程学习,试试做一两个项目挑战自己。

https://inst.eecs.berkeley.edu/~cs188/

https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-034-artificial-intelligence-fall-2010/

学习强化学习之前需要掌握的3种技能

 

3.理解学术论文

注意,我并没有说阅读学术论文,关键是要能够理解它们。

学术领域变化迅速,每天都有论文在活跃的Twitter社区中公布(说真的,关注几位著名的研究人员——这对你跟上进度很有帮助)。你需要学习的是把有影响力的论文与噪音区分开,把进步与炒作区分开。

它不是关于引用量,尽管我承认引用是一个很好的区别途径。你应该关注的是实验:它们是遵循提出问题、实验、提出解决方案的轨迹,还是只是对另一个方法的渐进改进?最好的论文寻找的是真理,而不是数字。

最好的研究是寻找最重要的问题,而不管学术讨论的浪潮。学会辨别这些信号,你就能跟上这个领域的步伐,成为未来十年有价值的人才。

学习强化学习之前需要掌握的3种技能

 

结尾

我写了很多关于强化学习的基本技能的教程,之后会发布出来。

  1. 什么是马尔科夫决策过程?
  2. 强化学习的线性代数。
  3. 强化学习的基本迭代方法。


Tags:强化学习   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
在这篇综述性文章中,作者详尽地介绍了多智能强化学习的理论基础,并阐述了解决各类多智能问题的经典算法。此外,作者还以 AlphaGo、AlphaStar为例,概述了多智能体强化学习的实际应用。...【详细内容】
2020-11-05  Tags: 强化学习  点击:(110)  评论:(0)  加入收藏
1.监督学习现代强化学习几乎完全集中在深度强化学习上。深度强化学习中的“深”一词意味着在算法的核心方面使用神经网络。神经网络在学习过程中进行一些高维近似。话虽如...【详细内容】
2020-07-19  Tags: 强化学习  点击:(72)  评论:(0)  加入收藏
模型结构模型同时学习action value Q、state value V和policy π。 V中引入Target V,供Q学习时使用;Target Network使学习有章可循、效率更高。 Q有两个单独的网络,选取最小...【详细内容】
2020-07-05  Tags: 强化学习  点击:(457)  评论:(0)  加入收藏
▌简易百科推荐
作为数据科学家或机器学习从业者,将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。在本文中,我将介绍两个...【详细内容】
2021-12-17  deephub    Tags:AI   点击:(16)  评论:(0)  加入收藏
基于算法的业务或者说AI的应用在这几年发展得很快。但是,在实际应用的场景中,我们经常会遇到一些非常奇怪的偏差现象。例如,Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】
2021-11-08  数据学习DataLearner    Tags:机器学习   点击:(32)  评论:(0)  加入收藏
11月2日召开的世界顶尖科学家数字未来论坛上,2013年诺贝尔化学奖得主迈克尔·莱维特、2014年诺贝尔生理学或医学奖得主爱德华·莫索尔、2007年图灵奖得主约瑟夫·斯发斯基、1986年图灵奖得主约翰·霍普克罗夫特、2002...【详细内容】
2021-11-03  张淑贤  证券时报  Tags:人工智能   点击:(39)  评论:(0)  加入收藏
鉴于物联网设备广泛部署、5G快速无线技术闪亮登场,把计算、存储和分析放在靠近数据生成的地方来处理,让边缘计算有了用武之地。 边缘计算正在改变全球数百万个设备处理和传输...【详细内容】
2021-10-26    计算机世界  Tags:边缘计算   点击:(45)  评论:(0)  加入收藏
这是几位机器学习权威专家汇总的725个机器学习术语表,非常全面了,值得收藏! 英文术语 中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Samplin...【详细内容】
2021-10-21  Python部落    Tags:机器学习   点击:(43)  评论:(0)  加入收藏
要开始为开源项目做贡献,有一些先决条件:1. 学习一门编程语言:由于在开源贡献中你需要编写代码才能参与开发,你需要学习任意一门编程语言。根据项目的需要,在后期学习另一种语言...【详细内容】
2021-10-20  TSINGSEE青犀视频    Tags:机器学习   点击:(37)  评论:(0)  加入收藏
SimpleAI.人工智能、机器学习、深度学习还是遥不可及?来这里看看吧~ 从基本的概念、原理、公式,到用生动形象的例子去理解,到动手做实验去感知,到著名案例的学习,到用所学来实现...【详细内容】
2021-10-19  憨昊昊    Tags:神经网络   点击:(47)  评论:(0)  加入收藏
语言是人类思维的基础,当计算机具备了处理自然语言的能力,才具有真正智能的想象。自然语言处理(Natural Language Processing, NLP)作为人工智能(Artificial Intelligence, AI)的核心技术之一,是用计算机来处理、理解以及运...【详细内容】
2021-10-11    36氪  Tags:NLP   点击:(49)  评论:(0)  加入收藏
边缘计算是什么?近年来,物联网设备数量呈线性增长趋势。根据艾瑞测算, 2020年,中国物联网设备的数量达74亿,预计2025年突破150亿个。同时,设备本身也变得越来越智能化,AI与互联网在...【详细内容】
2021-09-22  汉智兴科技    Tags:   点击:(54)  评论:(0)  加入收藏
说起人工智能,大家总把它和科幻电影中的机器人联系起来,而实际上这些科幻场景与现如今的人工智能没什么太大关系。人工智能确实跟人类大脑很相似,但它们的显著差异在于人工智能...【详细内容】
2021-09-17  异步社区    Tags:人工智能   点击:(57)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条