高明！OpenAI提出HER算法，人工智能可像人类一样认识错误汲取教训-电子发烧友网

失败是成功之母：HER有自我审视能力。

OpenAI的研究人员集中精力于构建具有更强的学习能力的人工智能。得益于他们的增强学习系统OpenAI baselines，机器学习算法可以进行自主学习。目前，这个新的算法保证人工智能可以像人类一样从自己的错误中汲取教训。

这个进步源于OpenAI的研究人员在近期公布的名为“后见之明经验复现（Hindsight Experience Reply, HER）”的开源算法。正如名字所示，HER帮助人工智能系统在完成一项任务后，具有自我审视的能力。OpenAI的博客中提到，人工智能认为失败乃成功之母。

研究人员写到：“构建HER的关键在于利用人类的直觉：在实现某个任务时，虽然我们没有成功，但是在这个过程中我们学到一些不一样的东西，既然如此，为何不能将我们最终学到的知识作为我们最初的目标呢？“

简而言之，这意味着每一次失败的尝试都是为了实现一个意想不到的“虚拟”目标，而非既定目标。

回想一下你学骑单车的经历，在最开始的几次尝试中，你无法掌握平衡。但是这些经验告诉了你怎么骑车是不正确的，怎么做不能保持平衡。就像在人类的学习过程中，每一次的失败让我们距离成功更进一步。

奖励每一次失败，并且失败也不沮丧

通过使用HER，OpenAI希望他们的人工智能系统可以利用上述的方法来学习。与此同时，这种算法也被作为增强学习模型中的奖励机制的替代算法。为了训练人工智能，使其具有独立的学习能力，它需要包含一个奖励机制：如果人工智能算法达到了预期目标，就可以得到一个小奖励，就像奖励给小孩子一块奶油饼干一样，否则就什么都得不到。另外一个系统根据人工智能距离预期目标的距离来给出奖励。

但是这两种算法并不是完美的。第一个算法会阻碍学习，因为一个人工智能算法在训练过程中要么得到奖励，要么没得到。另一方面，根据IEEE Spectrum报道的内容显示，第二系统在实现时，需要衡量与目标的距离并给出奖励，这个过程是很需要技巧的。如果把每一个任务都当作是后见之明的目标，即使人工智能系统没有完成指定的任务，HER也会提供一个奖励。这样帮助人工智能更快更好地学习。

OpenAI 在他的的博客中提到：“通过进行这种奖励机制的替换，强化学习算法在实现某些目标后会获得一个学习信号，即使这个学习任务不是它最初希望实现的。如果重复这个过程，系统最终可以实现任意的目标，包括最初的既定目标。

这种方法并不意味着使用HER方法可以完全简化人工智能系统学习某个任务的过程。研究者表示：“在机器人上使用HER进行学习仍然很难实现，因为这个过程需要大量的数据“。

无论如何，正如OpenAI的模型所显示的，HER有助于鼓励人工智能系统像人类一样从错误中学习，两者的主要区别在于人工智能在面对失败的时候不会像一些脆弱的人类那样伤心沮丧。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1777

文章
43986

浏览量
230964
机器学习

机器学习

+关注

关注
66

文章
8141

浏览量
130686

原文标题：高明！OpenAI提出HER算法，AI系统学会从错误中学习

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

嵌入式人工智能的就业方向有哪些?

嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下，嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下，众多名企也纷纷在嵌入式人工智能

发表于 02-26 10:17

ai人工智能机器人

随着时间的推移，人工智能的发展越来越成熟，智能时代也离人们越来越近，近几年人工智能越来越火爆，人工智能的应用已经开始渗透到各行各业，与生活交融，成为人们无法拒绝，无法失去的

发表于 09-21 11:09

《通用人工智能：初心与未来》-试读报告

作者给出的结论。整体读下来，可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用

发表于 09-18 10:02

如何将人工智能应用到效能评估系统软件中去解决

　　如何将人工智能应用到效能评估系统软件中去解决　　华盛恒辉效能评估系统是一种非常实用的管理工具，它可以帮助组织和企业掌握其运营状况，优化业务流程，提高效率和生产力。然而，随着人工智能的迅猛发展

发表于 08-30 12:58

人工智能能否取代人类

人工智能能否取代人类 人工智能正逐渐成为一项革命性的技术，随着机器学习和深度学习的进步，人工智能的应用范围正在不断扩大，并且朝着越来越智能化

发表于 08-17 12:37 •4065次阅读

人工智能定义是什么

AI的基本概念源于逻辑学和计算机科学，它利用规则、算法和的数学模型来模拟人类的思维过程。AI可以分为三类：强人工智能、弱人工智能和超人工智能

发表于 08-14 14:46 •3679次阅读

人工智能会代替人类吗

首先，我们需要明确什么是人工智能。人工智能简单来说就是“一种用于模拟或延伸成人智能的方法和机器”，即通过模拟人类的思维过程，让机器能够像人类

发表于 08-14 14:45 •3260次阅读

人工智能会毁灭人类吗

人工智能会毁灭人类吗在如今的世界中，人工智能（AI）已经成为了一个不可或缺的部分。从推荐算法到智能家居设备，从自动驾驶汽车到医疗诊断，

发表于 08-12 17:26 •2290次阅读

人工智能是谁提出的

人工智能是谁提出的 人工智能是一项众所周知的技术，当前它的发展迅速，广泛应用于各个领域。但是，有关人工智能最早提出的人物以及它的历史背景，却

发表于 08-12 16:58 •2315次阅读

人工智能谁提出的

人工智能谁提出的 人工智能是一种以计算机为基础的技术，它涉及了许多不同的领域，包括计算机科学，数学，人类认知和哲学等。人工智能可以被定义为一

发表于 08-12 16:48 •2135次阅读

人工智能的算法有哪些？

人工智能的算法有哪些？随着人工智能技术的快速发展，在不断地挖掘和研究中，在人工智能算法中也出现了越来越多的类型。目前，人工智能算法主要包括

发表于 08-09 17:49 •1899次阅读

人工智能是否能超越人类智能？人类智能与人工智能的区别 人工智能带来的真正挑战

对人工智能的与人类智能关系的探讨在当下十分热门，我们对人工智能是否可能取代人类这个话题投入了巨大的好奇。在未来，

发表于 08-04 11:39 •830次阅读

OpenAI无法判断内容是否人工智能所写？

由于准确率低，OpenAI关闭了一个本应区分人类写作和人工智能的工具。OpenAI表示，它决定在7月20日结束其人工智能分类器。该公司表示：

发表于 07-31 16:33 •874次阅读

AI 人工智能的未来在哪？

人工智能、AI智能大模型已经孵化；繁衍过程将突飞猛进，ChatGPT已经上线。世界首富马斯克认为AI对人类是一种威胁；谷歌前CEO施密特认为AI和机器学习对

发表于 06-27 10:48

【书籍评测活动NO.16】通用人工智能：初心与未来

的新一波人工智能正在兴起。自然语言处理、人脸识别、自动驾驶、无人系统等复杂人工智能任务相继取得大的突破，人工智能在很多特定问题（如围棋、《星际争霸》游戏、医疗诊断等）的解决上甚至超过了

发表于 06-21 14:41

搜索历史

高明！OpenAI提出HER算法，人工智能可像人类一样认识错误汲取教训

评论

嵌入式人工智能的就业方向有哪些?

ai人工智能机器人

《通用人工智能：初心与未来》-试读报告

如何将人工智能应用到效能评估系统软件中去解决

人工智能能否取代人类

人工智能定义是什么

人工智能会代替人类吗

人工智能会毁灭人类吗

人工智能是谁提出的

人工智能谁提出的

人工智能的算法有哪些？

人工智能是否能超越人类智能？人类智能与人工智能的区别人工智能带来的真正挑战

OpenAI无法判断内容是否人工智能所写？

AI 人工智能的未来在哪？

【书籍评测活动NO.16】通用人工智能：初心与未来