0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开辟新篇章!谷歌机器学习又有新进展!

DR2b_Aiobservat 来源:YXQ 2019-06-22 11:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在谷歌最新的论文中,研究人员提出了“非政策强化学习”算法OPC,它是强化学习的一种变体,它能够评估哪种机器学习模型将产生最好的结果。数据显示,OPC比基线机器学习算法有着显著的提高,更加稳健可靠。

在谷歌AI研究团队一篇新发表的论文《通过非政策分类进行非政策评估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他们提出了所称的“非政策分类”,即OPC(off-policy classification)。它能够评估AI的表现,通过将评估视为一个分类问题来驱动代理性能。

研究人员认为他们的方法是强化学习的一种变体,它利用奖励来推动软件政策实现与图像输入协同工作这个目标,并扩展到包括基于视觉的机器人抓取在内的任务。

“完全脱离政策强化学习是一种变体。代理完全从旧数据中学习,对于工程师来说这是很有吸引力的,因为它可以在不需要物理机器人的情况下进行模型迭代。”

Robotics at Google(专注机器学的的谷歌新团队)的软件工程师Alexa Irpan写道,“完全脱离政策的RL,可以在先前代理收集的同一固定数据集上训练多个模型,然后选择出最佳的那个模型。”

但是OPC并不像听起来那么容易,正如Irpan在论文中所描述的,非政策性强化学习可以通过机器人进行人工智能模型培训,但不能进行评估。并且在需要评估大量模型的方法中,地面实况评估通常效率太低。

OPC在假设任务状态变化方面几乎没有随机性,同时假设代理在实验结束时用“成功或失败”来解决这个问题。两个假设中第二个假设的二元性质,允许为每个操作分配两个分类标签(“有效”表示成功或“灾难性”表示失败)。

另外,OPC还依赖Q函数(通过Q学习算法学习)来估计行为的未来总回报。代理商选择具有最大预期回报的行动,其绩效通过所选行动的有效频率来衡量(这取决于Q函数如何正确地将行动分类为有效与灾难性),并以分类准确性作为非政策评估分数。

(左图为基线,右图为建议的方法之一,SoftOpC)

谷歌AI团队使用完全非策略强化学习对机器学习策略进行了模拟培训,然后使用从以前的实际数据中列出的非策略分数对其进行评估。

在机器人抓取任务时,他们报告OPC的一种变体SoftOPC在预测最终成功率方面表现最佳。假设有15种模型(其中7种纯粹在模拟中训练)具有不同的稳健性,SoftOPC产生的分数与与真正的抓取成功密切相关,并且相比于基线方法更加稳定可靠。

在未来的研究中,研究人员打算用“噪声”(noisier)和非二进制动力学来探索机器学习任务。“我们认为这个结果有希望应用于许多现实世界的RL问题,”Irpan在论文结尾写道。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6273

    浏览量

    112329
  • 机器学习
    +关注

    关注

    67

    文章

    8572

    浏览量

    137528
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    神州数码旗下神州鲲泰携手江苏纺知云开启家纺产业数智化新篇章

     神州鲲泰携手江苏纺知云,以国产化算力底座融合家纺行业数据,破解家纺企业研发与品控关键环节痛点,单品开发效率提升10倍、验布效率提升3倍,开启家纺产业数智化新篇章
    的头像 发表于 04-15 17:05 770次阅读

    国资入主联创电子开启企业发展崭新篇章

    冬日暖阳耀赣江,联创电子谱新章。2025年12月25日,联创电子科技股份有限公司(证券简称:联创电子,股票代码:002036)股票复牌,正式书写企业发展历程中的崭新篇章
    的头像 发表于 01-09 14:47 1038次阅读

    从协议到实践——EtherNet/IP与NetStaX的最新进展

    从协议到实践——EtherNet/IP与NetStaX的最新进展
    的头像 发表于 12-19 15:26 1883次阅读
    从协议到实践——EtherNet/IP与NetStaX的最<b class='flag-5'>新进展</b>

    迅为Hi3403开发板驱动教程全面上线,开启嵌入式Linux开发新篇章

    迅为iTOP-Hi3403开发板linux驱动教程全面上线,开启嵌入式Linux开发新篇章
    的头像 发表于 12-18 14:23 1047次阅读
    迅为Hi3403开发板驱动教程全面上线,开启嵌入式Linux开发<b class='flag-5'>新篇章</b>!

    广汽集团与华为数字能源开启深度协同新篇章

    和充电表现、整车驾乘体验提升,围绕动力域相关系统和整车产品的设计、制造、销售服务展开深入合作,开启深度协同新篇章
    的头像 发表于 11-11 15:22 821次阅读

    西班牙工程与技术公司携手FLIR开启高温检测新篇章

    在钢铁制造这一传统而充满挑战的领域,高温与恶劣环境如同两道难以逾越的鸿沟,横亘在提升生产效率与质量的道路上。然而,西班牙工程与技术先锋BcB Informatica y Control携手Flir公司,构建了创新的技术解决方案,正为这一行业注入智能化升级的新动力,开启高温检测的新篇章
    的头像 发表于 11-02 11:37 1174次阅读

    华为网络技术赋能上海院开启智慧建筑新篇章

    智慧建筑的实践者和推动者,也正在通过网络技术的创新应用,打造智慧、绿色的高品质万兆园区新标杆,以数智力量共拓“城市更新”崭新篇章
    的头像 发表于 10-30 10:17 937次阅读

    成都华微与具身科技开启四川具身智能产业新篇章

    人形机器人整机平台“天行者2号”,更迎来产业链多方战略合作的重大突破,成都华微电子科技股份有限公司(以下简称成都华微)作为核心硬件合作伙伴参与签约,共同开启四川具身智能产业新篇章
    的头像 发表于 09-30 11:48 1530次阅读

    盘古信息PCB解决方案:破译智造密码,开启智造新篇章

    。如何突破瓶颈,实现从“制造”向“智造”的华丽转身,成为PCB企业亟待破解的时代课题。广东盘古信息科技股份有限公司(以下简称:盘古信息)洞察行业痛点,以重构之力,打造出IMS MOM制造运营管理系统PCB行业解决方案,开启PCB智造新篇章。 盘古
    的头像 发表于 09-09 08:52 865次阅读

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型及AI计算基础设施,为机器人领域开启新篇章

    NVIDIA 通过全新 Omniverse 库、Cosmos 物理 AI 模型及 AI 计算基础设施,为机器人领域开启新篇章   · 全新 NVIDIA Omniverse NuRec 3D
    的头像 发表于 08-12 11:29 2154次阅读
    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型及AI计算基础设施,为<b class='flag-5'>机器</b>人领域开启<b class='flag-5'>新篇章</b>

    上海光机所在激光驱动离子加速方面取得新进展

    图1 实验原理示意图 近期,中国科学院上海光学精密机械研究所超强激光科学与技术全国重点实验室宾建辉研究员团队在激光驱动离子加速方面取得新进展。相关研究成果分别以“Enhanced proton
    的头像 发表于 08-06 09:36 829次阅读
    上海光机所在激光驱动离子加速方面取得<b class='flag-5'>新进展</b>

    云台电机驱动:开启智能化时代的新篇章

    在科技飞速发展的今天,智能化已经渗透到我们生活的方方面面。而在众多科技领域中,云台电机驱动技术正以其独特的魅力,开启着智能化时代的新篇章
    的头像 发表于 07-23 18:16 1265次阅读

    东风汽车转型突破取得新进展

    上半年,东风汽车坚定高质量发展步伐,整体销量逐月回升,经营质量持续改善,自主品牌和新能源渗透率和收益性进一步提升,半年累计终端销售汽车111.6万辆,转型突破取得新进展
    的头像 发表于 07-10 15:29 1129次阅读

    编码器线:精准连接,高效传动,引领科技新篇章

    在日新月异的科技时代,每一个微小的进步都可能成为推动行业变革的关键。编码器线,这一看似不起眼的组件,却在自动化、智能制造、机器人技术等众多高科技领域中扮演着至关重要的角色。今天,就让我们一起走进编码器线的世界,探索它如何以精准连接和高效传动,引领科技新篇章
    的头像 发表于 06-27 16:57 1250次阅读

    TECNO与非洲足球联合会开启合作新篇章

    的延续,这次合作进一步深化了TECNO在非洲市场的战略布局。TECNO将持续以科技创新赋能非洲消费者,携手非洲杯,共创新篇章
    的头像 发表于 06-11 11:38 1302次阅读