0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第三代AI要处理“可解释性”问题

mK5P_AItists 来源:YXQ 2019-08-15 09:41 次阅读

语言是人类智能的重要标志,在人类文明中的地位与作用毋庸置疑,自然语言处理,通俗地解释就是“让计算机学习人类语言”。清华大学新设立的中心旨在通过加强人工智能的基础研究及其与人文社科学科的交叉合作,建立更强大的机器用知识库,进而提升人工智能对语言的学习和处理的能力。

孙茂松认为,目前人工智能同社会科学和人文科学的结合有两个主要的桥梁,一个是狭义的数据,比如说金融市场上的数据,可根据数据来预测市场行为;另一个就是语言文字形成的文本,比如新闻、消息、用户在社交网络上反映观点和情绪的各种“短信息”等等。

基于人类语言文字这一桥梁,自2015年底起,他指导一个最初以两位本科生为主体的课题小组,通过深度神经网络的方法,让机器对全部古代诗歌进行“阅读”并“理解”,在此基础上,推出了会作诗的AI——“九歌”,使人工智能“跨界”到了文学创作领域。由于公众的关注与参与,到目前为止“九歌”已经产生了差不多400万首诗,“从古流传至今的诗歌总量估计达不到400万首,如果这么想,效果也还不错。”小组目前正在研究现代诗的生成,以期满足大众越来越多样的“作诗要求”。

社会人文学科是一个很宽广的概念。除了文学外,今年以来人工智能研究院正在与清华大学法学院合作,在原有的法学基础上更多地加入计算与人工智能的成分。法学院越来越认识到,“计算法学”是未来法学研究的一个发展趋势。孙茂松也提到,近年来最高人民法院领导的案卷卷宗数字化、公开化是计算法学发展的一个重要基础。

未来是否会有“AI法官”时,孙茂松说,“应该会有‘人工智能辅助法官’。虽然本质上机器的能力肯定超不过优秀的法官,但机器确实有它的长处,比如说它可以快速阅读大量的卷宗,人有时候会判断有片面性、情绪上会有所波动、法官水平也会参差不齐,机器则不会。”

孙茂松指出,人工智能目前基于大数据的深层神经网络方法(也叫深度学习方法,见后)有可能为某些社会人文领域带来研究范式的改变。虽然清华人工智能研究院目前刚刚开始进行外汇兑换率预测的研究,但他认为人工智能与金融、经济的深度融合可望带来极具震撼力的成果,一旦深度学习方法被创造性地、系统性地应用到这个领域,甚至“这几年国际上能出一个诺贝尔经济学奖”。

针对金融、经济系统的高度复杂性,孙茂松认为,当把各类相关信息都涵盖进来,并且有高超的手段对这些信息进行“大一统”式的有效处理时,这个复杂系统的可预测性便会显著上升。他举了个例子,“蚂蚁王国有自己的一套运作规律,但这个规律有时会变得非常脆弱,因为可能突然来一个人,啪地来一脚,便给这个王国带来了灭顶之灾。仅仅从蚂蚁的世界来看,这个突发事件是不可预测的。但如果把人的因素包含进来,细致了解这个人的秉性,比如他是否是一个有爱心的人、是否是一名佛教徒等等,他的行为的可预测性就会大大提高,蚂蚁王国的不可预测性也会随之大大降低”。

在孙茂松看来,经典金融学或经济学的研究范式主要是依靠人的理性思辨和求解方程(无论是线性还是非线性方程)。但复杂且庞大的金融和经济系统里充满了不确定性,很多现象难以用方程显式地刻画。但深度学习方法具有高度的非线性性质,在大数据的驱动下,理论上它能隐式地模拟任何复杂的方程,更加有效地处理系统的不确定性。这就使得一种全新的金融学或经济学研究范式的产生成为可能。把“黑盒子”变成“灰盒子”

孙茂松的书架上摆着金融、语言、逻辑等各领域的书籍

“当代人工智能教父”、2018年图灵奖得主约书亚·本吉奥(Yoshua Bengio)认为,人工智能领域在近些年出现巨大变革要归功于 “深度学习”(deep learning)的出现。他在一篇名为《深度学习:人工智能的复兴》的署名文章中说,“近年来,深度学习已经成为了驱动人工智能领域发展的最主要力量,各大信息技术公司在这方面共掷下了数十亿美元的资金。”

本吉奥此前接受澎湃新闻(www.thepaper.cn)记者专访时表示,现有的自然语言处理系统掌握了大量的词汇量和语言转换的技巧,但是却并不理解句子的真正含义,机器“会犯一些非常愚蠢的错误,甚至没有两岁小孩的理解能力”。同时他认为,模拟人脑的神经网络以期能够实现类人工智能的机器学习技术,即神经网络技术对于新时代的意义是巨大的。

尽管意义巨大,但目前的深层神经网络系统存在着一个重大不足:给定一个输入,系统给出相应结果的深刻原因对人来说是不透明的,从这个意义上来说,它基本上是一个“黑盒子”。这就导致系统的稳健性会变大打折扣,系统的适用范围也会缩窄。当我们深究机器为什么犯错时(如机器翻译系统为什么把一句话翻成这样、而不翻成那样),机器却无法给出解释,“反正我就翻成这样,你看着用吧。”

此外,深度学习最擅长处理的是关联性:当输入“公鸡打鸣”这个词语时,它会自动联想到“太阳升起来了”这句话。这体现了一种关联性,但显然前者不是导致后者的原因。深度学习现在基本上没有因果推理能力。孙茂松说,深度学习只是在统计意义上“觉得”某两个东西是相关的,但两者之间到底有没有逻辑关系,它却浑然不知。

孙茂松进一步阐释,自然语言处理研究面临着同样的难题,实际上,“可解释性”是整个人工智能领域目前面临的困境,也是目前的国际学术研究前沿。研究者们正在努力让这个人工智能“黑盒子”至少变成一个“灰盒子”。孙茂松认为,在自然语言处理方面,知识库的构建或许是一个解决方法。以古诗词写作举例:“灞桥”后接“折柳”,深度学习应该能从诗库中捕捉到这个知识关联,但其它众多知识关联是否都能学到,就不好说了。但如果我们自觉地把跟“灞桥”相关的东西全预先列出来,如“灞水、驿站、销魂、断肠、长安、关中八景、李白、李商隐、孟浩然…”,建立起一个知识图谱,那么,机器就可以根据这个知识图谱比较自觉地去写诗,针对性更强,写诗过程也便具有了一定的可解释性。

根据人工智能研究院院长张钹院士的说法,人工智能在其发展史上已经先后经历了理性主义和经验主义两代。第三代人工智能应该是这两者的完美结合。解决可解释性问题,是其核心研究任务之一。

因为知识天然地具有一定解释性,知识库就带有一种可解释性。

“通专虽应兼顾,而重心所寄, 应在通而不在专”

以人工智能和大数据为标志的第四次工业革命到来之际,国内多所高校开始布局人工智能教育。2017年5月,中国科学院大学成立人工智能技术学院,成为我国人工智能技术领域首个全面开展教学和科研工作的新型学院;2018年,上海交通大学与南京大学先后建立了人工智能研究院与人工智能学院,南京大学还招收了首批人工智能专业本科学生。

而作为中国顶尖的高等学府,清华大学对顶尖人才培养一贯高度重视。2005年设立的计算机科学实验班(因其创始人、“图灵奖”唯一华人获奖者姚期智而得名“姚班”)是全国乃至全球领先的计算机人才培养的摇篮。一流的高等教育有责任助力计算机科学和人工智能达至下一个令人鼓舞的高度,更应该能够给这个时代带来颠覆性的影响。

那么,人工智能本科专业的设置是否必要?人工智能要不要在本科阶段就独立成系?

“通专虽应兼顾,而重心所寄, 应在通而不在专”,孙茂松用清华大学老校长梅贻琦的一句话为澎湃新闻记者解释了国内顶尖高校对于人工智能本科教育或许应有的态度。在参考了全球名校如MIT(麻省理工学院Massachusetts Institute of Technology)、斯坦福大学、CMU(卡耐基梅隆大学Carnegie Mellon University)等的课程建构后,孙茂松认为人工智能不应贸然独立于计算机科学技术的一级学科。当然,各个高校根据各自不同的情况和需要制定自己的发展策略,也是可以理解的。

“清华主要的还是要稳,没有特殊的需求不要变,一变反而变乱了,两拨人可能无序竞争了。” 整体稳定、积极探索是清华大学在人工智能本科教育上的方针。

今年,清华大学在“姚班”之外新设立了“智班”,全称为“清华学堂人工智能班”,在计算机教育结构大体不变的前提下,这个规模不大的实验班将对人工智能人才、特别是顶尖人才本科阶段的培养进行深度探索。而人工智能研究院的工作主要定位在研究生阶段,特别是博士生阶段的培养。

在本中心之前,清华大学陆续成立了人工智能研究院基础理论研究中心、智能机器人研究中心等七个研究机构。

孙茂松说,这八个中心的核心力量主要对应着人工智能研究的“初心”,也就是研究人的感知和认知。感知最重要的通道是视觉和听觉,所以设立了视觉智能和听觉智能中心;而认知体现人的语言、推理、逻辑、学习的能力,所以设立了基础理论中心、知识智能中心和自然语言处理中心等。再向外探索就是智能人机交互与智能多模态信息交互乃至机器人的相关研究,中心和中心之间是紧密联系、相互合作的。

刚满一周岁的清华人工智能研究院已基本实现了“整合力量、统筹安排”的目标。孙茂松表示,接下来的两个中心会分别以“社交网络大数据”和“人工智能芯片”为关键词。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43796

    浏览量

    230570
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130546

原文标题:对话清华教授孙茂松:第三代人工智能要处理“可解释性”问题

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    高通推出第三代骁龙7+移动平台

    在科技日新月异的今天,高通技术公司再度引领行业风向标,正式推出备受瞩目的第三代骁龙7+移动平台。此次更新不仅将终端侧生成式AI技术首次引入骁龙7系列,更在AI模型支持方面实现了跨越式进步。
    的头像 发表于 03-25 10:23 280次阅读

    高通推出第三代骁龙7+移动平台

    高通技术公司重磅推出了全新的第三代骁龙®7+移动平台,这一创新成果成功将终端侧生成式AI技术引入至骁龙7系,开启了全新的智能时代。这款移动平台不仅兼容众多AI模型,如Baichuan-7B、Gemini Nano、Llama 2
    的头像 发表于 03-22 14:13 566次阅读

    高通推出第三代骁龙8s移动平台,为智能手机带来行业领先的终端侧AI

    第三代骁龙8s移动平台通过特选的旗舰功能,带来出色的终端侧生成式AI特性以及影像和游戏体验。
    的头像 发表于 03-18 16:00 294次阅读

    戴尔公布第三代 Concept Luna 设计方案:模块化、低碳、AI、循环

    韩国chosun新闻网今日报导,戴尔全新亮相了第三代Concept Luna概念设计,重点关注四大核心元素——模块化设计、环保材料、先进AI监测技术以及循环利用。
    的头像 发表于 01-03 10:12 237次阅读

    是德科技第三代半导体动静态测试方案亮相IFWS

    2023年11月29日,第九届国际第三代半导体论坛(IFWS)和“第三代半导体标准与检测研讨会”成功召开,是德科技参加第九届国际第三代半导体论坛(IFWS),并重磅展出第三代半导体动静
    的头像 发表于 12-13 16:15 296次阅读
    是德科技<b class='flag-5'>第三代</b>半导体动静态测试方案亮相IFWS

    AMD扩展其第三代AMD EPYC处理器家族并推出6款全新产品

    和Supermicro在内的业界领先OEM厂商均展示了基于第三代AMD EPYC CPU的解决方案— 近日,AMD 宣布扩展其第三代AMD EPYC处理器家族并推出6款全新产品,以通过具备鲁棒性的数据中心
    的头像 发表于 11-11 10:37 983次阅读

    高通第三代骁龙8采用4纳米工艺 支持在终端侧运行超100亿参数的生成式AI

    高通第三代骁龙8采用4纳米工艺 支持在终端侧运行超100亿参数的生成式AI 前两天高通公司在骁龙峰会发布了针对笔记本电脑的骁龙X Elite和针对手机移动端的第三代骁龙8。 高通第三代
    的头像 发表于 10-26 19:29 1305次阅读
    高通<b class='flag-5'>第三代</b>骁龙8采用4纳米工艺 支持在终端侧运行超100亿参数的生成式<b class='flag-5'>AI</b>

    高通发布第三代骁龙8移动平台,为下一代旗舰智能手机带来生成式AI

    要点 — •  第三代骁龙8是高通技术公司首个专为生成式AI而精心打造的移动平台。 •  该平台将带来行业领先的AI、卓越影像特性、主机级游戏体验以及专业品质音频,再结合全球最快的连接,赋能消费者
    的头像 发表于 10-25 10:30 359次阅读
    高通发布<b class='flag-5'>第三代</b>骁龙8移动平台,为下一代旗舰智能手机带来生成式<b class='flag-5'>AI</b>

    欧瑞博新一代智能开关搭载启英泰伦第三代AI语音芯片

    近日,全球知名品牌全屋智能家居科技公司欧瑞博发布了新一代智能开关,该智能开关搭载启英泰伦自研的第三代AI语音芯片,具备强大的离线语音控制能力。
    的头像 发表于 10-19 14:47 514次阅读

    第三代半导体的应用面临哪些挑战?如何破局?

    近年来,碳化硅(SiC)、氮化镓(GaN)等第三代半导体材料成为全球半导体市场热点之一。
    的头像 发表于 10-16 14:45 792次阅读

    机器学习模型可解释性的结果分析

    模型的可解释性是机器学习领域的一个重要分支,随着 AI 应用范围的不断扩大,人们越来越不满足于模型的黑盒特性,与此同时,金融、自动驾驶等领域的法律法规也对模型的可解释性提出了更高的要求,在可解
    发表于 09-28 10:17 509次阅读
    机器学习模型<b class='flag-5'>可解释性</b>的结果分析

    如何开发智能家居语音控制方案

    与主控平台实现通信,使得整体方案功能更佳强大,可与云平台配合处理更佳复杂的逻辑算法,并具备更强的AI处理能力。 独立主控硬件框图 串口与主控通信硬件框图 启英泰伦推出的第三代高性能
    发表于 05-31 09:50

    如何化解第三代半导体的应用痛点

    所谓第三代半导体,即禁带宽度大于或等于2.3eV的半导体材料,又称宽禁带半导体。常见的第三代半导体材料主要包括碳化硅(SiC)、氮化镓(GaN)、氮化铝(AIN)、氧化锌(ZnO)和金刚石等,其中
    的头像 发表于 05-18 10:57 1079次阅读

    第三代半导体以及芯片的核心材料

    第三代半导体以及芯片的核心材料
    的头像 发表于 05-06 09:48 2812次阅读
    <b class='flag-5'>第三代</b>半导体以及芯片的核心材料

    文献综述:确保人工智能可解释性和可信度的来源记录

    本文对数据起源、可解释AI(XAI)和可信赖AI(TAI)进行系统的文献综述,以解释基本概念,说明数据起源文件可以用来提升基于人工智能系统实现可解释
    的头像 发表于 04-28 15:55 962次阅读
    文献综述:确保人工智能<b class='flag-5'>可解释性</b>和可信度的来源记录