0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何深度强化学习 人工智能和深度学习的进阶

8gVR_D1Net08 2018-03-03 14:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

传统上,强化学习在人工智能领域占据着一个合适的地位。但强化学习在过去几年已开始在很多人工智能计划中发挥更大的作用。其最佳的应用点在于计算艾真体(agent)在环境上情境化的决策场景中要采取的最佳行动。

强化学习非常适合自主决策,因为单靠监督学习或无监督学习技术无法完成任务。

传统上,强化学习在人工智能领域占据着一个合适的地位。但强化学习在过去几年已开始在很多人工智能计划中发挥更大的作用。其最佳的应用点在于计算艾真体(agent)在环境上情境化的决策场景中要采取的最佳行动。

强化学习使用试错法将算法奖励函数最大化,它非常适用于IT运营管理、能源、医疗保健、商业、金融、交通和金融领域的很多自适应控制和艾真体自动化应用。它用来训练人工智能,它为传统的重点领域提供支持——机器人技术、游戏和模拟——以及边缘分析、自然语言处理、机器翻译、计算机视觉和数字助理等新一代人工智能解决方案。

强化学习也是物联网中自主边缘应用程序开发的基础。很多边缘应用程序的开发(工业、交通、医疗和消费应用)涉及对注入了人工智能的机器人技术的构建,这些技术可以在动态环境条件下以不同程度的情境自主性进行操作。

强化学习如何工作

在这样的应用领域中,边缘设备的人工智能大脑必须依赖强化学习,由于在这里缺少预先存在的“真实值(ground truth)”训练数据集,他们试图将累计奖励函数最大化,例如根据规范中包含的一组标准组装一个生产组件。这与其它类型的人工智能的学习方式形成对比,后者要么是(像监督学习一样)对相对于真实值数据的算法上的损失函数进行最小化,要么(像无监督学习一样)对数据点之间的距离函数进行最小化。

但是,这些人工智能学习方法不一定是孤岛。最有趣的人工智能趋势之一是强化学习与更高级的应用程序中的监督学习和无监督学习的融合。人工智能开发人员将这些方法融入到仅凭单一的学习方法不足为用的应用程序中。

例如,监督学习本身在没有标记的训练数据的情况下是无用的,在自动驾驶这样的应用中往往缺乏标记的训练数据,在这里,每个瞬时的环境情况本质上都是未标记且独特的。同样,无监督学习(使用聚类分析来检测传感器馈源和其它复杂的未标记数据中的模式)并非用来发现智能终端在真实世界的决策场景中应采取的最佳操作。

什么是深度强化学习

然后是深层强化学习,这是一种领先的技术,在这种技术中,自治的艾真体(autonomous agent)使用强化学习的试错算法和累计奖励函数来加速神经网络设计。这些设计为很多依靠监督和/或无监督学习的人工智能应用程序提供支持。

深度强化学习是人工智能开发和培训管道自动化的核心重点领域。它涉及对强化学习驱动的艾真体的使用,以快速探索与无数体系结构、节点类型、连接、超参数设置相关的性能权衡,以及对深度学习机器学习和其他人工智能模型设计人员可用的其它选择。

例如,研究人员正在使用深度强化学习来快速确定哪一种深度学习卷积神经网络(CNN)架构可能用于解决特征工程、计算机视觉和图像分类中的各种难题。人工智能工具可能会使用从深度强化学习获得的结果来自动生成最佳CNN,使用TensorFlow、MXNet或PyTorch等深度学习开发工具来完成该任务。

在这方面,看到强化学习发展和培训的开放框架的出现是鼓舞人心的。你在探索深度强化学习时可能需要探索下面这些强化学习框架,这些框架利用、扩展并与TensorFlow和其它深度学习和机器学习建模工具接合,这些工具已得到广泛采用:

强化学习

人工智能开发人员需要的强化学习技能

展望未来,人工智能开发人员将需要沉浸在这些框架和其它框架中实施的各种强化学习算法中。你还需要加深对多艾真体强化学习架构的理解,这其中有很多架构大量利用老牌的博弈论研究机构。你还要熟悉深度强化学习,以此来发现计算机视觉应用中与名为“模糊”的攻击方法相关的安全漏洞。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50453

    浏览量

    267506

原文标题:什么是深度强化学习:人工智能和深度学习的下一步

文章出处:【微信号:D1Net08,微信公众号:AI人工智能D1net】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能深度学习系统班v12.0 第12期咕泡

    突破学习难点,深度学习进阶心得 在深度学习的这条路上,入门并不算太难。跑通一个MNIST手写数字
    的头像 发表于 05-08 18:10 865次阅读

    人工智能深度学习系统班13期

    人工智能深度学习13期:零基础转行AI高薪不用走弯路 站在2026年的当下,人工智能的浪潮已经彻底重塑了全球就业市场的版图。对于程序员而言,这既是前所未有的职业危机,也是实现阶层跃迁的
    的头像 发表于 05-07 16:46 231次阅读

    人工智能-Python深度学习进阶与应用技术:工程师高培解读

    深度学习进阶的技术路线图,来分析解读一下从基础原理到前沿应用的多个关键节点。一、从基础到进阶:构建深度
    的头像 发表于 04-21 11:01 440次阅读
    <b class='flag-5'>人工智能</b>-Python<b class='flag-5'>深度</b><b class='flag-5'>学习</b><b class='flag-5'>进阶</b>与应用技术:工程师高培解读

    智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    内容概要:文档内容介绍了中图仪器(Chotest)影像测量仪融合人工智能深度学习与飞拍技术的自动化检测解决方案。系统通过AI深度学习实现
    发表于 03-31 17:11

    Momenta强化学习大模型助力别克至境世家纯电版正式上市

    3月17日,别克至境世家纯电版正式上市,这是别克与Momenta强化学习大模型的又一次深度联手。融合别克在MPV市场深耕27年的技术积淀,以更从容的智慧驾控,重新定义豪华与自在的出行体验。
    的头像 发表于 03-18 15:48 382次阅读

    自动驾驶中常提的离线强化学习是什么?

    [首发于智驾最前沿微信公众号]在之前谈及自动驾驶模型学习时,详细聊过强化学习的作用,由于强化学习能让大模型通过交互学到策略,不需要固定的规则,从而给自动驾驶的落地创造了更多可能。 强化学习
    的头像 发表于 02-07 09:21 412次阅读
    自动驾驶中常提的离线<b class='flag-5'>强化学习</b>是什么?

    人工智能与机器学习在这些行业的深度应用

    人工智能和机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能(AI)与机器学习
    的头像 发表于 02-04 14:44 743次阅读

    强化学习会让自动驾驶模型学习更快吗?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶大模型训练时,有的技术方案会采用模仿学习,而有些会采用强化学习。同样作为大模型的训练方式,强化学习有何不同?又有什么特点呢? 什么是强化学习
    的头像 发表于 01-31 09:34 914次阅读
    <b class='flag-5'>强化学习</b>会让自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    智能强化学习(MARL)核心概念与算法概览

    训练单个RL智能体的过程非常简单,那么我们现在换一个场景,同时训练五个智能体,而且每个都有自己的目标、只能看到部分信息,还能互相帮忙。这就是多智能强化学习
    的头像 发表于 01-21 16:21 369次阅读
    多<b class='flag-5'>智能</b>体<b class='flag-5'>强化学习</b>(MARL)核心概念与算法概览

    机器学习深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 383次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    自动驾驶中常提的“强化学习”是个啥?

    下,就是一个智能体在环境里行动,它能观察到环境的一些信息,并做出一个动作,然后环境会给出一个反馈(奖励或惩罚),智能体的目标是把长期得到的奖励累积到最大。和监督学习不同,强化学习没有一
    的头像 发表于 10-23 09:00 974次阅读
    自动驾驶中常提的“<b class='flag-5'>强化学习</b>”是个啥?

    如何在机器视觉中部署深度学习神经网络

    图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“
    的头像 发表于 09-10 17:38 1107次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    深度学习对工业物联网有哪些帮助

    深度学习作为人工智能的核心分支,通过模拟人脑神经网络的层级结构,能够自动从海量工业数据中提取复杂特征,为工业物联网(IIoT)提供了从数据感知到智能决策的全链路升级能力。以下从技术赋能、场景突破
    的头像 发表于 08-20 14:56 1291次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能领域主要
    发表于 08-07 14:23