0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高明!OpenAI提出HER算法,人工智能可像人类一样认识错误汲取教训

DPVg_AI_era 来源:未知 作者:伍文辉 2018-05-01 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

失败是成功之母:HER有自我审视能力。

OpenAI的研究人员集中精力于构建具有更强的学习能力的人工智能。得益于他们的增强学习系统OpenAI baselines,机器学习算法可以进行自主学习。目前,这个新的算法保证人工智能可以像人类一样从自己的错误中汲取教训。

这个进步源于OpenAI的研究人员在近期公布的名为“后见之明经验复现(Hindsight Experience Reply, HER)”的开源算法。正如名字所示,HER帮助人工智能系统在完成一项任务后,具有自我审视的能力。OpenAI的博客中提到,人工智能认为失败乃成功之母。

研究人员写到:“构建HER的关键在于利用人类的直觉:在实现某个任务时,虽然我们没有成功,但是在这个过程中我们学到一些不一样的东西,既然如此,为何不能将我们最终学到的知识作为我们最初的目标呢?“

简而言之,这意味着每一次失败的尝试都是为了实现一个意想不到的“虚拟”目标,而非既定目标。

回想一下你学骑单车的经历,在最开始的几次尝试中,你无法掌握平衡。但是这些经验告诉了你怎么骑车是不正确的,怎么做不能保持平衡。就像在人类的学习过程中,每一次的失败让我们距离成功更进一步。

奖励每一次失败,并且失败也不沮丧

通过使用HER,OpenAI希望他们的人工智能系统可以利用上述的方法来学习。与此同时,这种算法也被作为增强学习模型中的奖励机制的替代算法。为了训练人工智能,使其具有独立的学习能力,它需要包含一个奖励机制:如果人工智能算法达到了预期目标,就可以得到一个小奖励,就像奖励给小孩子一块奶油饼干一样,否则就什么都得不到。另外一个系统根据人工智能距离预期目标的距离来给出奖励。

但是这两种算法并不是完美的。第一个算法会阻碍学习,因为一个人工智能算法在训练过程中要么得到奖励,要么没得到。另一方面,根据IEEE Spectrum报道的内容显示,第二系统在实现时,需要衡量与目标的距离并给出奖励,这个过程是很需要技巧的。如果把每一个任务都当作是后见之明的目标,即使人工智能系统没有完成指定的任务,HER也会提供一个奖励。这样帮助人工智能更快更好地学习。

OpenAI 在他的的博客中提到:“通过进行这种奖励机制的替换,强化学习算法在实现某些目标后会获得一个学习信号,即使这个学习任务不是它最初希望实现的。如果重复这个过程,系统最终可以实现任意的目标,包括最初的既定目标。

这种方法并不意味着使用HER方法可以完全简化人工智能系统学习某个任务的过程。研究者表示:“在机器人上使用HER进行学习仍然很难实现,因为这个过程需要大量的数据“。

无论如何,正如OpenAI的模型所显示的,HER有助于鼓励人工智能系统像人类一样从错误中学习,两者的主要区别在于人工智能在面对失败的时候不会像一些脆弱的人类那样伤心沮丧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50366

    浏览量

    267058
  • 机器学习
    +关注

    关注

    67

    文章

    8567

    浏览量

    137259

原文标题:高明!OpenAI提出HER算法,AI系统学会从错误中学习

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    未来五年,人工智能给你的生活带来哪些改变

    未来五年,人工智能电力一样,无声无息地融入你生活的每个角落。它不是科幻电影里的机器人,而是系列能看、能听、能分析、能预测的智能服务。
    的头像 发表于 04-17 16:17 200次阅读

    人工智能五大核心:芯片、算力、数据、算法、能源 !

    在全球科技革命的浩荡浪潮中,人工智能已成为重塑人类文明形态的核心驱动力。那么,人工智能究竟由何构成?支撑其持续迭代进化的内在技术体系又是什么?本文聚焦人工智能发展的五大核心支柱:芯片、
    的头像 发表于 04-16 12:47 707次阅读
    <b class='flag-5'>人工智能</b>五大核心:芯片、算力、数据、<b class='flag-5'>算法</b>、能源 !

    浅谈人工智能(2)

    。 强人工智能(Strong AI),又称通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以胜任人类所有工作的
    的头像 发表于 02-22 08:24 379次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    自然智能与人工智能融合如何重塑芯片设计

    人类大脑是所有处理器中最复杂的,能够构思出不可思议的创意,解决复杂、微妙的问题。相比之下,人工智能擅长快速分析海量数据并高效执行任务。当自然智能人工智能融合的结果,就是芯片设计领域正
    的头像 发表于 01-15 13:58 712次阅读

    连载|开发工具,易安卓让系统功能调用写应用逻辑一样简单

    通过自研系统封装库,易安卓将复杂的系统控制能力以接口形式开放给开发者,让系统功能调用写应用逻辑一样简单。
    的头像 发表于 11-27 11:40 87次阅读
    连载|开发工具,易安卓让系统功能调用<b class='flag-5'>像</b>写应用逻辑<b class='flag-5'>一样</b>简单

    怎么kell一样设置rom下载起始地址?

    如题,怎么kell一样设置rom下载起始地址?
    发表于 10-10 07:21

    AI看点:OpenAI口气建5个算力中心 去年中国人工智能产业规模超9千亿元

    给大家带来一些人工智能资讯消息: OpenAI口气建5个算力中心 日前,OpenAI公司正式宣布将与甲骨文、软银在美国新建五个大型人工智能
    的头像 发表于 09-25 18:13 2233次阅读

    现场解决EMC电磁辐射干扰:“望闻问切”,中医一样

    南柯电子|现场解决EMC电磁辐射干扰:“望闻问切”,中医一样
    的头像 发表于 09-04 09:47 1078次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!☎(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!☎(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    天吃透条产业链:具身智能(AI+机器人)

    01 产业链全景图 02 具身智能简介 简单来说,具身智能就是给人工智能赋予个实体,让它能够人类
    的头像 发表于 06-19 09:21 2745次阅读
    <b class='flag-5'>一</b>天吃透<b class='flag-5'>一</b>条产业链:具身<b class='flag-5'>智能</b>(AI+机器人)

    维智科技为什么提出时空人工智能

    世界的关键转折点。为此,陶闯博士提出“时空人工智能”(Spatio-Temporal AI)概念,试图系统性地回答个问题:如何让AI看得懂空间、学得会语义、做得了决策?
    的头像 发表于 06-12 14:30 1058次阅读

    如何构建边缘人工智能基础设施

    随着人工智能的不断发展,其争议性也越来越大;而在企业和消费者的眼中,人工智能价值显著。如同许多新兴科技一样,目前人工智能的应用主要聚焦于大规模、基础设施密集且高功耗的领域。然而,随着
    的头像 发表于 06-09 09:48 1227次阅读

    这个超强AI模型!开始不听人类指令,拒绝关闭!

    电子发烧友网综合报道 OpenAI现今最强大的人工智能推理模型“o3”被指在收到明确的人类指令时,拒绝执行关机操作。近日,人工智能安全研究公司Palisade Research在社交媒
    的头像 发表于 05-28 00:06 7434次阅读