0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新型的强化学习算法,能够教导算法如何在没有人类协助的情况下解开魔方

Qp2m_ggservicer 来源:未知 作者:李倩 2018-06-22 16:49 次阅读

据外媒CNET报道,创建一个可以解开魔方的算法相对简单。但是,如果在没有人类帮助的情况下解开魔方可能是一个完全不同的任务。加利福尼亚大学的Stephen McAleer和他的同事们认为他们已经解决了这个问题,并采用了一个称为“自学的渐进迭代”的过程。

McAleer和他的团队称这个过程为“一种新型的强化学习算法,能够教导算法如何在没有人类协助的情况下解开魔方。” 他们声称,这种学习算法可以在30步内解开100%的随机打乱魔方 - 这和人类的表现不相上下或优于人类的表现。

这种类型的算法与在棋类游戏中超越人类表现的算法有区别。这些系统是“强化学习”系统。这个系统在完成解魔方后会查看是否每个提议的步骤都是一种改进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4455

    浏览量

    90750
  • 强化学习
    +关注

    关注

    4

    文章

    259

    浏览量

    11113

原文标题:GGAI 前沿 | 机器学习算法现在可以在没有人类帮助的情况下解开魔方

文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是深度强化学习?深度强化学习算法应用分析

    什么是深度强化学习? 众所周知,人类擅长解决各种挑战性的问题,从低级的运动控制(如:步行、跑步、打网球)到高级的认知任务。
    发表于 07-01 10:29 1186次阅读
    什么是深度<b class='flag-5'>强化学习</b>?深度<b class='flag-5'>强化学习</b><b class='flag-5'>算法</b>应用分析

    机器学习工程师必知的10大算法

    `转篇好资料机器学习算法可以分为三大类:监督学习、无监督学习强化学习。监督
    发表于 04-18 18:28

    反向强化学习的思路

    强化学习的另一种策略(二)
    发表于 04-03 12:10

    深度强化学习实战

    内容2:课程: TensoRFlow入门到熟练:课程二:图像分类:课程三:物体检测:课程四:人脸识别:课程五:算法实现:1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成
    发表于 01-10 13:42

    强化学习和监督式学习, 非监督式学习的区别

    而这时,强化学习会在没有任何标签的情况下,通过先尝试做出一些行为得到一个结果,通过这个结果是对还是错的反馈,调整之前的行为,就这样不断的调整,算法
    的头像 发表于 08-21 09:18 1.9w次阅读
    <b class='flag-5'>强化学习</b>和监督式<b class='flag-5'>学习</b>, 非监督式<b class='flag-5'>学习</b>的区别

    基于强化学习的MADDPG算法原理及实现

    之前接触的强化学习算法都是单个智能体的强化学习算法,但是也有很多重要的应用场景牵涉到多个智能体之间的交互。
    的头像 发表于 11-02 16:18 2.1w次阅读

    量化深度强化学习算法的泛化能力

    OpenAI 近期发布了一个新的训练环境 CoinRun,它提供了一个度量智能体将其学习经验活学活用到新情况的能力指标,而且还可以解决一项长期存在于强化学习中的疑难问题——即使是广受赞誉的强化
    的头像 发表于 01-01 09:22 2151次阅读
    量化深度<b class='flag-5'>强化学习</b><b class='flag-5'>算法</b>的泛化能力

    谷歌发布非政策强化学习算法OPC的最新研究机器学习即将开辟新篇章?

    在谷歌最新的论文中,研究人员提出了“非政策强化学习算法OPC,它是强化学习一种变体,它能够评估哪种机器
    的头像 发表于 06-22 11:17 3399次阅读

    懒惰强化学习算法在发电调控REG框架的应用

    惰性是人类的天性,然而惰性能让人类无需过于复杂的练习就能学习某项技能,对于人工智能而言,是否可有基于惰性的快速学习的方法?本文提出一种懒惰
    发表于 01-16 17:40 779次阅读

    基于PPO强化学习算法的AI应用案例

    Viet Nguyen就是其中一个。这位来自德国的程序员表示自己只玩到了第9个关卡。因此,他决定利用强化学习AI算法来帮他完成未通关的遗憾。
    发表于 07-29 09:30 2477次阅读

    机器学习中的无模型强化学习算法及研究综述

    强化学习( Reinforcement learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种学习范式,通过与环境进行
    发表于 04-08 11:41 11次下载
    机器<b class='flag-5'>学习</b>中的无模型<b class='flag-5'>强化学习</b><b class='flag-5'>算法</b>及研究综述

    一种新型的多智能体深度强化学习算法

    一种新型的多智能体深度强化学习算法
    发表于 06-23 10:42 36次下载

    强化学习的基础知识和6种基本算法解释

    定标记训练数据的情况下获得正确的输出 无监督学习(UL):关注在没有预先存在的标签的情况下发现数据中的模式 强化学习(RL) : 关注智能体
    的头像 发表于 12-20 14:00 878次阅读

    7个流行的强化学习算法及代码实现

    作者:Siddhartha Pramanik 来源:DeepHub IMBA 目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。这些算法
    的头像 发表于 02-03 20:15 819次阅读

    强化学习的基础知识和6种基本算法解释

    情况下获得正确的输出无监督学习(UL):关注在没有预先存在的标签的情况下发现数据中的模式强化学习(RL):关注智能体在环境中如何采取行动以
    的头像 发表于 01-05 14:54 485次阅读
    <b class='flag-5'>强化学习</b>的基础知识和6种基本<b class='flag-5'>算法</b>解释