机器学习领域的强化学习技术有什么用处？-电子发烧友网

来自查尔默斯大学和哥德堡大学的跨学科研究团队开发了一个框架，用于研究语言如何演变为描述心理概念的有效工具。在一篇新论文中，他们表明，人工代理可以学习如何以类似于人类语言的人工语言进行交流。该结果已发表在科学杂志《PLOS ONE》上。

这项研究位于认知科学和机器学习之间的边界。认知科学家提出了一个有影响力的建议，即所有人类语言都可以看作是进化成为一种以经典信息论的意义以接近最优的方式传达概念的手段。哥德堡研究人员训练人工代理的方法是基于强化学习的，强化学习是机器学习的一个领域，代理通过与环境交互并获得反馈逐渐学习。在这种情况下，代理人在没有任何语言知识的情况下开始学习，并通过获取有关他们在传达思想观念方面的成功程度的反馈来学习交流。

重建色彩

“在我们的论文中，我们研究了代理商如何通过打几轮由发送者和听者组成的参考游戏来学习命名心理概念和进行交流。我们特别关注了在认知科学中已深入研究的色域。游戏的工作方式如下;发送方看到一种颜色，并通过从词汇表向听众说出一个单词来描述颜色，然后尝试重建颜色。

根据收听者重建的精确程度，这两个代理都会收到共享的奖励。词汇表中的单词一开始就没有意义;在游戏的多个回合中，由代理商决定单词的含义。我们看到，从信息论的角度来看，由此产生的人工语言几乎是最优的，并且具有与人类语言相似的特性。” Sleepcycle研究人员MikaelKågebäck说，他在Chalmers的博士学位论文中包含了一些结果在论文中提出。

与哥德堡大学语言理论和概率研究中心（CLASP）计算机语言学研究人员Asad Sayeed以及教授Devdatt Dubhashi和Emil Carlsson博士一起。他是计算机科学与工程系数据科学和AI部门的学生，现在已经发表了结果。

Asad Sayeed说：“从实际的角度来看，这项研究提供了开发与人类语言进行交流的对话主体（例如Siri和Alexa）的基本原理。”

通过强化学习来学习交流的基本思想对于社会和文化领域的研究也很有趣，例如，由阿萨德·萨耶德（Asad Sayeed）领导的GRIPES项目，该项目研究狗舌政治。

在将来的研究中有用

“认知实验非常耗时，因为您经常需要对人类志愿者进行仔细的实验。我们的方法提供了一种非常强大，灵活且廉价的方法来研究这些基本问题。实验完全在我们的控制之下，可重复且完全可靠因此，我们的计算框架为研究认知科学，语言和交互作用中的基本问题提供了一种有价值的工具。对于计算机科学家来说，探索各种学习机制的有效性是一个肥沃的领域。” Devdatt Dubhashi说。

Emil Carlsson说：“将来，我们要调查代理商是否也可以在其他领域发展类似于人类语言的交流。一个例子就是我们的代理商是否能够重构我们在人类语言中观察到的等级结构。”

长期存在的问题

该研究源于认知科学和语言学一个长期存在的中心问题：在人类语言的所有巨大多样性中，是否存在共同的普遍原则。20世纪的经典作品表明，用不同的语言来描述颜色具有共同的特性。是否有解释这些共同属性的基本原则？

认知科学家最近提出的一项有影响力的建议是，从信息论的角度来看，当语言被视为一种交流思想概念，最有效地利用资源的手段时，确实存在着这样的普遍通用原则。

麻省理工学院的特德·吉布森（Ted Gibson）于2016年在CLASP上发表了一系列演讲，他在演讲中描述了从世界各地不同社会和文化中选出的人类受试者的实验结果，从而引发了一个问题：“如果人类受试者被人造计算机替代，将会怎样代理，他们会开发一种具有类似通用属性的语言吗？”
责任编辑：tzh

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

计算机

计算机

+关注

关注
19

文章
6643

浏览量
84471
AI

AI

+关注

关注
87

文章
26403

浏览量
264006
机器学习

机器学习

+关注

关注
66

文章
8108

浏览量
130542

什么是强化学习

强化学习是机器学习的方式之一，它与监督学习、无监督学习并列，是三种机器

发表于 10-30 11:36 •1607次阅读

NeurIPS 2023 | 扩散模型解决多任务强化学习问题

扩散模型（diffusion model）在 CV 领域甚至 NLP 领域都已经有了令人印象深刻的表现。最近的一些工作开始将 diffusion model 用于强化学习（RL）中来解决序列决策问题

发表于 10-02 10:45 •445次阅读

NeurIPS 2023 | 扩散模型解决多任务<b class='flag-5'>强化学习</b>问题

模拟矩阵在深度强化学习智能控制系统中的应用

讯维模拟矩阵在深度强化学习智能控制系统中的应用主要是通过构建一个包含多种环境信息和动作空间的模拟矩阵，来模拟和预测深度强化学习智能控制系统在不同环境下的表现和效果，从而优化控制策略和提高系统的性能

发表于 09-04 14:26 •326次阅读

模拟矩阵在深度<b class='flag-5'>强化学习</b>智能控制系统中的应用

深度学习和机器学习的定义和优缺点深度学习和机器学习的区别

　　深度学习和机器学习是机器学习领域中两个重要的概念，都是人工智能

发表于 08-21 18:27 •2139次阅读

机器学习有哪些算法？机器学习分类算法有哪些？机器学习预判有哪些算法？

发表于 08-17 16:30 •1386次阅读

机器学习是什么意思？机器学习属于什么分支？机器学习有什么用处？

机器学习是什么意思？机器学习属于什么分支？机器学习是什么有什

发表于 08-17 16:30 •1266次阅读

机器学习和深度学习的区别

机器学习和深度学习的区别随着人工智能技术的不断发展，机器学习和深度

发表于 08-17 16:11 •3368次阅读

机器学习可以分为哪几类？机器学习技术有哪些？

机器学习可以分为哪几类？机器学习技术有哪些机器学习

发表于 08-17 16:11 •4353次阅读

基于强化学习的目标检测算法案例

摘要：基于强化学习的目标检测算法在检测过程中通常采用预定义搜索行为，其产生的候选区域形状和尺寸变化单一，导致目标检测精确度较低。为此，在基于深度强化学习的视觉目标检测算法基础上，提出联合回归与深度

发表于 07-19 14:35 •0次下载

45. 5 2 强化学习（深度强化学习） #硬声创作季

机器学习

充八万
发布于 :2023年07月07日 01:56:26

什么是深度强化学习?深度强化学习算法应用分析

什么是深度强化学习? 众所周知，人类擅长解决各种挑战性的问题，从低级的运动控制(如：步行、跑步、打网球)到高级的认知任务。

发表于 07-01 10:29 •1183次阅读

人工智能强化学习开源分享

电子发烧友网站提供《人工智能强化学习开源分享.zip》资料免费下载

发表于 06-20 09:27 •1次下载

ICLR 2023 Spotlight｜节省95%训练开销，清华黄隆波团队提出强化学习专用稀疏训练框架RLx2

大模型时代，模型压缩和加速显得尤为重要。传统监督学习可通过稀疏神经网络实现模型压缩和加速，那么同样需要大量计算开销的强化学习任务可以基于稀疏网络进行训练吗？本文提出了一种强化学习专用稀疏训练框架

发表于 06-11 21:40 •399次阅读

彻底改变算法交易：强化学习的力量

强化学习（RL）是人工智能的一个子领域，专注于决策过程。与其他形式的机器学习相比，强化学习模型通过与环境交互并以奖励或惩罚的形式接收反馈来

发表于 06-09 09:23 •367次阅读

机器学习笔记之优化-拉格朗日乘子法和对偶分解

优化是机器学习中的关键步骤。在这个机器学习系列中，我们将简要介绍优化问题，然后探讨两种特定的优化方法，即拉格朗日乘子和对偶分解。这两种方法在机器

发表于 05-30 16:47 •1426次阅读