0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习领域的强化学习技术有什么用处?

我快闭嘴 来源:教育新闻网 作者:教育新闻网 2020-08-12 16:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来自查尔默斯大学和哥德堡大学的跨学科研究团队开发了一个框架,用于研究语言如何演变为描述心理概念的有效工具。在一篇新论文中,他们表明,人工代理可以学习如何以类似于人类语言的人工语言进行交流。该结果已发表在科学杂志《PLOS ONE》上。

这项研究位于认知科学和机器学习之间的边界。认知科学家提出了一个有影响力的建议,即所有人类语言都可以看作是进化成为一种以经典信息论的意义以接近最优的方式传达概念的手段。哥德堡研究人员训练人工代理的方法是基于强化学习的,强化学习是机器学习的一个领域,代理通过与环境交互并获得反馈逐渐学习。在这种情况下,代理人在没有任何语言知识的情况下开始学习,并通过获取有关他们在传达思想观念方面的成功程度的反馈来学习交流。

重建色彩

“在我们的论文中,我们研究了代理商如何通过打几轮由发送者和听者组成的参考游戏来学习命名心理概念和进行交流。我们特别关注了在认知科学中已深入研究的色域。游戏的工作方式如下;发送方看到一种颜色,并通过从词汇表向听众说出一个单词来描述颜色,然后尝试重建颜色。

根据收听者重建的精确程度,这两个代理都会收到共享的奖励。词汇表中的单词一开始就没有意义;在游戏的多个回合中,由代理商决定单词的含义。我们看到,从信息论的角度来看,由此产生的人工语言几乎是最优的,并且具有与人类语言相似的特性。” Sleepcycle研究人员MikaelKågebäck说,他在Chalmers的博士学位论文中包含了一些结果在论文中提出。

与哥德堡大学语言理论和概率研究中心(CLASP)计算机语言学研究人员Asad Sayeed以及教授Devdatt Dubhashi和Emil Carlsson博士一起。他是计算机科学与工程系数据科学和AI部门的学生,现在已经发表了结果。

Asad Sayeed说:“从实际的角度来看,这项研究提供了开发与人类语言进行交流的对话主体(例如Siri和Alexa)的基本原理。”

通过强化学习来学习交流的基本思想对于社会和文化领域的研究也很有趣,例如,由阿萨德·萨耶德(Asad Sayeed)领导的GRIPES项目,该项目研究狗舌政治。

在将来的研究中有用

“认知实验非常耗时,因为您经常需要对人类志愿者进行仔细的实验。我们的方法提供了一种非常强大,灵活且廉价的方法来研究这些基本问题。实验完全在我们的控制之下,可重复且完全可靠因此,我们的计算框架为研究认知科学,语言和交互作用中的基本问题提供了一种有价值的工具。对于计算机科学家来说,探索各种学习机制的有效性是一个肥沃的领域。” Devdatt Dubhashi说。

Emil Carlsson说:“将来,我们要调查代理商是否也可以在其他领域发展类似于人类语言的交流。一个例子就是我们的代理商是否能够重构我们在人类语言中观察到的等级结构。”

长期存在的问题

该研究源于认知科学和语言学一个长期存在的中心问题:在人类语言的所有巨大多样性中,是否存在共同的普遍原则。20世纪的经典作品表明,用不同的语言来描述颜色具有共同的特性。是否有解释这些共同属性的基本原则?

认知科学家最近提出的一项有影响力的建议是,从信息论的角度来看,当语言被视为一种交流思想概念,最有效地利用资源的手段时,确实存在着这样的普遍通用原则。

麻省理工学院的特德·吉布森(Ted Gibson)于2016年在CLASP上发表了一系列演讲,他在演讲中描述了从世界各地不同社会和文化中选出的人类受试者的实验结果,从而引发了一个问题:“如果人类受试者被人造计算机替代,将会怎样代理,他们会开发一种具有类似通用属性的语言吗?”
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7769

    浏览量

    92780
  • AI
    AI
    +关注

    关注

    90

    文章

    38336

    浏览量

    297434
  • 机器学习
    +关注

    关注

    66

    文章

    8542

    浏览量

    136297
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    今日看点:智元推出真机强化学习;美国软件公司SAS退出中国市场

    智元推出真机强化学习机器人训练周期从“数周”减至“数十分钟”   近日,智元机器人宣布其研发的真机强化学习技术,已在与龙旗科技合作的验证产
    发表于 11-05 09:44 925次阅读

    自动驾驶中常提的“强化学习”是个啥?

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,有些方案中会提到“强化学习(Reinforcement Learning,简称RL)”,强化学习是一类让机器通过试错来学会做决策的技术
    的头像 发表于 10-23 09:00 357次阅读
    自动驾驶中常提的“<b class='flag-5'>强化学习</b>”是个啥?

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 2655次阅读

    NVIDIA Isaac Lab可用环境与强化学习脚本使用指南

    Lab 是一个适用于机器人学习的开源模块化框架,其模块化高保真仿真适用于各种训练环境,Isaac Lab 同时支持模仿学习(模仿人类)和强化学习(在尝试和错误中进行学习),为所有
    的头像 发表于 07-14 15:29 1912次阅读
    NVIDIA Isaac Lab可用环境与<b class='flag-5'>强化学习</b>脚本使用指南

    18个常用的强化学习算法整理:从基础方法到高级模型的理论技术与代码实现

    本来转自:DeepHubIMBA本文系统讲解从基本强化学习方法到高级技术(如PPO、A3C、PlaNet等)的实现原理与编码过程,旨在通过理论结合代码的方式,构建对强化学习算法的全面理解。为确保内容
    的头像 发表于 04-23 13:22 1352次阅读
    18个常用的<b class='flag-5'>强化学习</b>算法整理:从基础方法到高级模型的理论<b class='flag-5'>技术</b>与代码实现

    **【技术干货】Nordic nRF54系列芯片:传感器数据采集与AI机器学习的完美结合**

    传感器数据采集与AI机器学习领域的明星产品。想深入了解?快来评论区交流,或点击[链接]获取更多技术细节! ? #nRF54 #AI机器
    发表于 04-01 00:00

    详解RAD端到端强化学习后训练范式

    受限于算力和数据,大语言模型预训练的 scalinglaw 已经趋近于极限。DeepSeekR1/OpenAl01通过强化学习后训练涌现了强大的推理能力,掀起新一轮技术革新。
    的头像 发表于 02-25 14:06 1048次阅读
    详解RAD端到端<b class='flag-5'>强化学习</b>后训练范式

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 642次阅读

    人工智能和机器学习以及Edge AI的概念与应用

    与人工智能相关各种技术的概念介绍,以及先进的Edge AI(边缘人工智能)的最新发展与相关应用。 人工智能和机器学习是现代科技的核心技术 人工智能(AI)和
    的头像 发表于 01-25 17:37 1618次阅读
    人工智能和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>以及Edge AI的概念与应用

    嵌入式机器学习的应用特性与软件开发环境

    作者:DigiKey Editor 在许多嵌入式系统中,必须采用嵌入式机器学习(Embedded Machine Learning)技术,这是指将机器
    的头像 发表于 01-25 17:05 1250次阅读
    嵌入式<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用特性与软件开发环境

    DAC1282的正弦波模式什么用处

    ADS1282增益校准时,需要外部提供和增益匹配的满量程电压,这个电压可以由DAC1282提供。我想问的是: 1.DAC1282的正弦波模式什么用处? 2.采用哪种模式提供电压最好?
    发表于 12-31 07:03

    传统机器学习方法和应用指导

    用于开发生物学数据的机器学习方法。尽管深度学习(一般指神经网络算法)是一个强大的工具,目前也非常流行,但它的应用领域仍然有限。与深度学习相比
    的头像 发表于 12-30 09:16 1997次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 714次阅读

    【「具身智能机器人系统」阅读体验】+初品的体验

    动态互动的。 该理论强调智能行为源于智能体的物理存在和行为能力,智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理及强化学
    发表于 12-20 19:17

    zeta在机器学习中的应用 zeta的优缺点分析

    的应用(基于低功耗广域物联网技术ZETA) ZETA作为一种低功耗广域物联网(LPWAN)技术,虽然其直接应用于机器学习的场景可能并不常见,但它可以通过提供高效、稳定的物联网通信支持,
    的头像 发表于 12-20 09:11 1641次阅读