0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器是否也能拥有“意识”?何通过数学和计算机程序来实现这一点?

DPVg_AI_era 来源:未知 作者:李倩 2018-10-08 11:25 次阅读

9月20日,在新智元AI WORLD 2018世界人工智能峰会上,伦敦大学学院计算机系教授汪军作了《论机器意识的可能和实现》的演讲。汪军教授的研究方向之一是多智体强化学习,由于最近在研究“机器意识”这个课题,汪军教授的演讲也从“意识”讲起,最后讨论了机器是否也能拥有“意识”,如果答案是肯定的,那我们又该如何通过数学和计算机程序来实现这一点?

我们是谁?我们从哪里来?到哪里去?

这是一个永恒的问题。

9月20日,在新智元AI WORLD 2018世界人工智能峰会上,伦敦大学学院计算机系教授汪军作了《论机器意识的可能和实现》的演讲。

伦敦大学学院计算机系教授汪军

汪军教授的研究方向之一是多智体强化学习,也就是有多个“agent”互动,包括沟通、协作与竞争。由于最近在研究“机器意识”这个课题,汪军教授的演讲也从“意识”讲起,最后讨论了机器是否也能拥有“意识”,如果答案是肯定的,那我们又该如何通过数学和计算机程序来实现这一点。

汪军教授介绍了他们团队研究用AI打桥牌的例子。相比完全信息博弈的围棋和不完全信息但只需要一对一的德州扑克,桥牌是一种不完全信息博弈,而且需要选手两两组队,相互合作与竞争。这个游戏更贴近于现实世界发生的情况。

研究结果表明,AI在打桥牌时,能够学会相互隐秘地沟通,最终取胜。也是这一点,让汪军教授想到机器意识兴起与实现的可能。

“很多原理实际上并没有那么复杂,”汪军教授说:“只要你去研究并做出来的话。”当然,现在还都是非常初步的探索,因为首先,目前学界对“意识”还没有统一的定义。

以下是汪军教授在新智元AI WORLD 2018世界人工智能峰会上发表的演讲实录。

机器意识的兴起和实现不是没有可能

汪军:我给大家放个好玩的视频

我想通过这个视频引出我今天要讲的话题:我们自己到底是谁?我们从哪里来?到哪里去?这个话题非常非常大。让我们先看看哲学家的理解。

有一点是很有意思的:我们作为个体,我们自己会有感情,我们会有爱,有恨。当我们听到王菲的歌,会觉得是天籁之音;当我们听到摇滚乐,我们会非常兴奋;当我们阅读一本书的时候,我们会隔空和作者进行心灵上的沟通。

这一切就定义了我们人类,它其实跟人的意识有关。关于意识,17世纪的时候哲学家笛卡尔已经做过一些系统的研究和学说。比如他提出“二元论”的理论,认为人作为个体存在两个世界,一个是灵魂世界,一个是肉体世界,通过大脑里一个叫松果体的部位进行交互。通过这种交互,产生了人的各种各样的行为。这个理论非常有局限性,无法解释很多比较高级的认知智能,所以最后也就流于唯心主义的理论了。

人的意识到底是什么?现在学术圈普遍认同的一个定义是“主观的经验”,就是说意识和现实可能不一样,是你自己主观的感受。有一个好的评判方法是可以用某种方式去表达,告诉别人。

例如,请看上面这张图。如果大家聚焦视线,把注意力放在中间的+上,会发现边上的圆圈会逐渐消失,当把眼睛挪到别的地方,边上的圆圈又出现了。说明你看到的东西并不代表就是真实的,它们之间有差别。通过大脑能给出一定的解释。

意识作为科学的一个学科或作为科学的一个研究课题,其实也只是在上世纪90年代大家才开始非常严肃去研究。有两位比较主要的贡献者,一位是Francis Crick,他是英国的生物学家、物理学家和神经科学家。他最大的成就是和他的同事James Watson发现了DNA的分子结构,并因此共同获得了诺贝尔生理及医学奖。他们两个一起提出了一系列实验方法去测量当有意识时,大脑里面的神经活动是怎样形成关联。这从某种意义上证明了意识是有一种机制存在于大脑中的。

之后其他研究人员继续在这个范围研究。法国有一位科学家研究发现在控制人的身体时,其实有两种不同的机制。做相同的动作,可以是潜意识的,也可以是有意识的。他设计了一个比较巧妙的实验方法,可以把潜意识和有意识的动作分开,然后用脑电波或大脑造影做测试,看大脑神经元的激活状态。他发现在有意识和无意识情况下,神经元的激活是不一样的。有意识时候,神经元激活的位置是在大脑比较高级的部位,而且比较全面、多方面;潜意识的时候,神经元激活的位置是在比较低级的地方。

另外一个很有意思的研究,科学家发现了条件反射的机制,提出其实这个机制跟计算机里的强化学习方法其实是一样的,即通过一个多巴胺神经元,预测到有一个错误,对这个错误不断进行更正。

人和机器其实都是信息处理系统。既然是信息处理系统,可以从三个不同的层次去理解:

1. 计算理论是什么,到底需要计算什么。

2. 表征和具体算法

3. 具体硬件实现。

我个人认为前面两点,人和机器是非常相似的,甚至会问同样的问题。只有到第三个层次,硬件的状态,人和机器是不太一样的。

计算理论。意识到底是什么?目前还不是那么明晰,但是有一些不同的理论提出来,这里我讲两个可以接受的理论:

1.Global Neuronal Workspace,就是认为意识是在大脑里进行的全局的互相的信息共享,比如在工作台上你可以拿出以前的记录,比如内存,可以去看一些低层次的视觉上的结果,有一些奖励机制。通过这些信息共享把大脑各个部门及时调动起来,这时候就有意识了。

2.从信息集成度来解释意识。集成信息理论是解释大脑内部信息之间交换的一个理论,也就是说如果这个系统在全局里的信息量大于任何内部小子集的信息量,就可以认为信息集成度高的有可能产生意识。

如果它们之间能够交换,有空间跟时间上的关系,比如有内存的话,比较简单的模型有意识的可能是比较高的。

元世界模型:对世界建模

有了这个理论,看看现在机器学习,特别是强化学习方面到底做了什么,我们有什么缺陷,再去提高理论和实际算法。

比如说,这是微信的跳一跳小游戏,我们将图像作为输入,用算法做判断,机械臂点按屏幕来玩这个游戏。我买了这个机器臂,没玩两个星期就折了,我在微信里发了一下,一个深圳厂家说,汪老师你这个太烂了,我送你一个。然后就送我一个,我玩了大概一个月左右又坏了。

这个小东西很有意思,可以理解神经网络从一个图像进去,最后一个决策出来,是怎么回事。图上亮点的地方指示系统的注意力在哪里,左边两个图是做正确的决策,取决于知道自己位置在哪里,知道前方目标在哪里。而右边两个都是错误决策,我们会看到方向判断错了。比如第二幅图目标放到了相反的方向,所以最后按键计算就是错误的,目标也是错误的。

当计算出两个目标以后,神经元激活了,激活以后,每个神经元控制一个目标,这个目标就是在它的范围内激活的,到最后一层时,把信息结合起来,就能算出到底应该按多长时间。

这跟我们做分类其实是一样的,就是从输入一直到输出。用集成信息理论来讲,它是不可能产生跟人一样的智慧的,就算能够做成ALphaGo,能够超过人类,也是没有人的意识的。

那么强化学习的弱点如何解决?我们的思路是Agent内部算法有不同的层次,我们要潜意识拿一些统计数据过来,然后通过所谓的Global Neuronal Workspace把各个信息集成起来,再去决策。主要两个部分,一是对周围环境的建模,一是对敌人(对手)的建模。

人每天都经历不同的环境,环境世界是有个性的,我们就给单个Agent做了一个Meta-World Model,就是多个世界集合在一起,发现它的共性。当我们学到Meta-World Model以后,Agent就可以想像了,可以做梦了,可以在它的脑子里面去运转了。这个不是从外面采集的,是Agent在它的算法里面不断玩这个游戏的状态,通过它,我们可以去做决策。

我们有一个很有意思的发现,当建立一个世界模型时,特别是Meta-World Model,Agent就知道它在这个图像里面处于哪个位置了。如果看以前任何玩游戏的模型,其实Agent不知道它是在图像里哪个部位的,但我们用这个Meta-World Model就可以知道。

多智能体如何合作

我们知道BP算法是主流的深度学习算法,但用在多智能体时,却失败了。例如,这是一个非常简单的matrix game,左图是用BP去计算的,认为Agent之间是独立的,是不可以收敛的。当对其他对手建模时,发现非常快就可以收敛到中间。我们建了对敌方建模的方法来玩多Agent的游戏。

我们让Agent去打桥牌,这个任务很有意思,跟AlphaGo相比有两个大的技术难点:

1. Agent之间是合作关系,而围棋只是一个Agent。

2. 不完全信息。在打牌时,对方手上的牌你是不知道的,所以在建模时,要不断预测。

在这个环境下,如何去理解两个Agent之间如何合作?

我们聚焦在叫牌这个阶段,目前为止还没有人可以解决。上图左边是专业选手在玩桥牌时,两个人会坐下来定一个规矩,比如出2红心时,告诉你我的牌是什么,出3黑桃时,告诉我你的牌是什么,他们俩约定好,打牌时把信息就传给对方。

我们让Agent去学习时,开始不知道,通过我们这个模型就学出来了它们自己不明晰的通讯方式,通过互相叫牌,把信息传给对方,这是他们之间约定的一个Code,它是一个最优的解。

例如,刚开始,北家的Agent是红桃,当两者不停叫牌时,最后通过通讯方式知道其实两个加在一起时,黑桃会更好,就改变了叫的花色。如果玩的是两个Agent,Agent多的情况下怎么办?我们把一个多Agent到上百万转换成两个Agent,相当于一个Agent和周围其他人的平均值做一个交互。

最后讲一下应用。对其他Agent做一个模型,包括对世界建一个模型,从意识里更进一步,并不代表它就有意识了。但是我们只往前走了一小步,实际应用里有更多以前无法解决的场景可以解决,比如互联网广告里,广告主去排名竞价时会考虑到其他广告主的行为。

我们现在正在探讨多智能体在无人车领域的应用。在某些特定场景,比如说过匝道时,怎样在拥挤的情况下对其他车辆进行模拟,以及对匝道环境模拟,怎样有效地在堵车情况下通过。另外一个应用场景是在交通路口红绿灯的时候,怎样通过跟别人的交互,高效地通过交通路口。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    6644

    浏览量

    84479
  • 人工智能
    +关注

    关注

    1776

    文章

    43808

    浏览量

    230572
  • 机器
    +关注

    关注

    0

    文章

    756

    浏览量

    40491

原文标题:UCL汪军:论机器意识的可能和实现

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    感觉量子技术神奇神秘,希望通过阅读此书认识量子计算机。 先浏览下目录: 通过目录,基本可以确定这是
    发表于 03-05 17:37

    【量子计算机重构未来 | 阅读体验】+ 了解量子叠加原理

    如何生产制造。。。。。。 近来通过阅读《量子计算机—重构未来》书,结合网络资料,了解了一点点量子叠加知识,分享给大家。 先提下电子
    发表于 03-13 17:19

    计算机语言概述

    语言指令之间是一一对应的。由于汇编语言般都是为特定计算机计算机系统设计的,因此,它虽然比机器语言好学、便于记忆,比用机器码编写
    发表于 12-06 00:17

    DV与计算机连接后完成什么功能?

    带有USB接口(除了早期的机器,如NV-DS25EN等),连接线会随机奉送,此线端是标准的USB接口,与
    发表于 03-16 10:44

    计算机基础知识

    科学的发展奠定了基础,而每克服它的个缺点,都对计算机的发展带来很大影响,其中影响最大的就是“程序存储”方式的采用。将程序存储方式的设想确立为体系的是美国
    发表于 03-08 15:50

    机器视觉与计算机视觉的关系简述

    初涉机器视觉领域,总是容易将其与计算机视觉这一概念混淆。实际上两者确实存在定的相同之处,但也不能因此而将这两者视为同概念,因为这两者还存
    发表于 05-13 14:57

    世界上第计算机程序是干嘛用的?

    的影响便是促使阿兰·图灵产生通用程序存储计算机的想法。这一点Ada并没有看到,她36岁去 世,前面提到的注释成了她唯的出版物。如果她再
    发表于 12-03 14:53

    量子计算机或将提前实现

    些顶尖研究团队根据最新发现,认为量子计算机实现可以比我们想象的更早。前日,谷歌和西班牙巴斯克大学的研究人员公布了项研究成果,根据该成果,人类有望以较之前简便的多的方法构建
    发表于 06-13 10:31

    labview如何通过ftp登陆远程计算机

    想请教各位大神,labview如何通过ftp登陆远程计算机,然后查询远程计算机的里的文件,或者不通过ftp可以,目的就是登陆远程
    发表于 02-11 22:34

    【我是电子发烧友】七步带你认识计算机视觉(Computer Vision)

    的离散推理(Discrete Inference in Artificial Vision)课程,它能提供相关的概率图形模型和计算机视觉相关的大量数学知识。到现在这一步来看就比较有趣了,这门课程
    发表于 06-14 21:06

    如何用SCB-UART组件向计算机发送个可变字符串?

    大家好,我想用SCB-UART组件向计算机发送个可变字符串(例如:变化的ADC值)。我怎样才能做到这一点呢?我使用的工具包是CY8CKIT-042-BLE,我还利用TrimTM仿真器
    发表于 10-10 10:15

    计算机编程 精选资料分享

    想到用什么算法解决问题。这里要学的基本就是基于计算机数学了。同样要实现个目的有很多种方法,你要做的就是找出符合你目标的最优算法。举个例子,要算出100的阶乘(100!),这里可以单
    发表于 07-15 06:09

    计算机有哪些功能

    句话概括:计算机体系结构讲的是计算机有哪些功能(包括指令集、数据类型、存储器寻址技术、I/O机理等等),是抽象的;计算机组成原理讲的是计算机
    发表于 07-16 07:45

    什么是程序?什么是计算机

    什么是程序程序(Program)流程、议程、行程、…为了完成某项任务,解决某个问题需要执行的系列步骤计算机程序为了完成某项任务,解决某个
    发表于 11-23 09:02

    计算机数学教程之《计算机数学基础》电子教材计算机的必备数学基础免费下载

    本书基于计算机的普及应用,全面、系统地介绍了使用计算机的必备数学基础。全书共分四篇,分别为;商等数学简介,线性代数初步、科学计算入门和微机应
    发表于 09-13 08:00 0次下载