0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高明!OpenAI提出HER算法,人工智能可像人类一样认识错误汲取教训

DPVg_AI_era 来源:未知 作者:伍文辉 2018-05-01 16:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

失败是成功之母:HER有自我审视能力。

OpenAI的研究人员集中精力于构建具有更强的学习能力的人工智能。得益于他们的增强学习系统OpenAI baselines,机器学习算法可以进行自主学习。目前,这个新的算法保证人工智能可以像人类一样从自己的错误中汲取教训。

这个进步源于OpenAI的研究人员在近期公布的名为“后见之明经验复现(Hindsight Experience Reply, HER)”的开源算法。正如名字所示,HER帮助人工智能系统在完成一项任务后,具有自我审视的能力。OpenAI的博客中提到,人工智能认为失败乃成功之母。

研究人员写到:“构建HER的关键在于利用人类的直觉:在实现某个任务时,虽然我们没有成功,但是在这个过程中我们学到一些不一样的东西,既然如此,为何不能将我们最终学到的知识作为我们最初的目标呢?“

简而言之,这意味着每一次失败的尝试都是为了实现一个意想不到的“虚拟”目标,而非既定目标。

回想一下你学骑单车的经历,在最开始的几次尝试中,你无法掌握平衡。但是这些经验告诉了你怎么骑车是不正确的,怎么做不能保持平衡。就像在人类的学习过程中,每一次的失败让我们距离成功更进一步。

奖励每一次失败,并且失败也不沮丧

通过使用HER,OpenAI希望他们的人工智能系统可以利用上述的方法来学习。与此同时,这种算法也被作为增强学习模型中的奖励机制的替代算法。为了训练人工智能,使其具有独立的学习能力,它需要包含一个奖励机制:如果人工智能算法达到了预期目标,就可以得到一个小奖励,就像奖励给小孩子一块奶油饼干一样,否则就什么都得不到。另外一个系统根据人工智能距离预期目标的距离来给出奖励。

但是这两种算法并不是完美的。第一个算法会阻碍学习,因为一个人工智能算法在训练过程中要么得到奖励,要么没得到。另一方面,根据IEEE Spectrum报道的内容显示,第二系统在实现时,需要衡量与目标的距离并给出奖励,这个过程是很需要技巧的。如果把每一个任务都当作是后见之明的目标,即使人工智能系统没有完成指定的任务,HER也会提供一个奖励。这样帮助人工智能更快更好地学习。

OpenAI 在他的的博客中提到:“通过进行这种奖励机制的替换,强化学习算法在实现某些目标后会获得一个学习信号,即使这个学习任务不是它最初希望实现的。如果重复这个过程,系统最终可以实现任意的目标,包括最初的既定目标。

这种方法并不意味着使用HER方法可以完全简化人工智能系统学习某个任务的过程。研究者表示:“在机器人上使用HER进行学习仍然很难实现,因为这个过程需要大量的数据“。

无论如何,正如OpenAI的模型所显示的,HER有助于鼓励人工智能系统像人类一样从错误中学习,两者的主要区别在于人工智能在面对失败的时候不会像一些脆弱的人类那样伤心沮丧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261498
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136232

原文标题:高明!OpenAI提出HER算法,AI系统学会从错误中学习

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    怎么kell一样设置rom下载起始地址?

    如题,怎么kell一样设置rom下载起始地址?
    发表于 10-10 07:21

    现场解决EMC电磁辐射干扰:“望闻问切”,中医一样

    南柯电子|现场解决EMC电磁辐射干扰:“望闻问切”,中医一样
    的头像 发表于 09-04 09:47 429次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!☎(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!☎(壹捌伍 柒零零玖 壹壹捌陆)
    发表于 08-07 14:23

    维智科技为什么提出时空人工智能

    世界的关键转折点。为此,陶闯博士提出“时空人工智能”(Spatio-Temporal AI)概念,试图系统性地回答个问题:如何让AI看得懂空间、学得会语义、做得了决策?
    的头像 发表于 06-12 14:30 747次阅读

    如何构建边缘人工智能基础设施

    随着人工智能的不断发展,其争议性也越来越大;而在企业和消费者的眼中,人工智能价值显著。如同许多新兴科技一样,目前人工智能的应用主要聚焦于大规模、基础设施密集且高功耗的领域。然而,随着
    的头像 发表于 06-09 09:48 848次阅读

    文速览:人工智能(AI)算法与GPU运行原理详解

    改变了人类生活的方方面面,并且在未来仍然会继续发挥越来越重要的影响力。 “人工智能”这概念在1956年于美国达特茅斯学院举办的次学术集会上被首次
    的头像 发表于 02-14 10:28 1394次阅读
    <b class='flag-5'>一</b>文速览:<b class='flag-5'>人工智能</b>(AI)<b class='flag-5'>算法</b>与GPU运行原理详解

    我国生成式人工智能的发展现状与趋势

    (Generative Artificial Intelligence, GenAI)推动人工智能算法智能(Algorithmic Intelligence,AI)进入语言智能(Li
    的头像 发表于 02-08 11:31 2120次阅读

    1750亿美元资金筹备中:OpenAI加速人工智能基础设施建设

    近日,据OpenAI最新消息,该公司正紧锣密鼓地推进其人工智能基础设施的建设进程,并计划在2025年晚些时候,于阿比林地区交付第批数据中心计算资源。这举措标志着
    的头像 发表于 02-08 10:55 791次阅读

    OpenAI目标转向“超级智能

    (superintelligence)”。 Altman在博客中强调,OpenAI对于当前的产品充满热爱,但公司的使命远不止于此。他们在这里,是为了追求个更加辉煌的未来,个由超级智能
    的头像 发表于 01-07 10:57 705次阅读

    OpenAI公布2025年发展目标

    公布的目标中,AGI(通用人工智能)位列榜首。AGI作为人工智能领域的终极目标之,旨在创造出能够人类
    的头像 发表于 01-03 10:40 1117次阅读

    算法到生命,自动化人工生命搜索已然显现?

    生命体一样运作。 ASAL 其中位研究者 Phillip Isola 近日,Sakana AI团队携手麻省理工学院(MIT)、开放人工智能研究院(
    的头像 发表于 12-31 10:54 776次阅读
    从<b class='flag-5'>算法</b>到生命,自动化<b class='flag-5'>人工</b>生命搜索已然显现?

    OpenAI攻克Sora视频创建错误率高难题

    人工智能与多媒体技术的交叉领域,OpenAI近期宣布了项重要进展:成功解决了Sora视频创建过程中错误率高的问题。这突破不仅标志着
    的头像 发表于 12-31 10:37 842次阅读

    OpenAI考虑取消AGI条款

    近日,据英国《金融时报》报道,OpenAI正在与微软就项重要条款进行磋商,该条款涉及未来通用人工智能(AGI)技术的使用权。 据了解,OpenAI与微软此前签订的合同中,包含了
    的头像 发表于 12-09 14:35 944次阅读

    人工智能时代的秩序、安全与和平

    人类智慧的主观性,而这对于负责任地行使武力至关重要。与其说人工智能是对未知事物的进步发现,不如说它是对我们现有状况的揭示。战争中的人工智能将揭示
    的头像 发表于 12-07 11:53 1138次阅读