0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习自动化(AutoML):让机器自己炼丹

Hf1h_BigDataDig 来源:YXQ 2019-06-21 11:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

要不要用准确性换可解释性?这可能是许多资源有限的创业公司,在技术研发中面临的重要问题,同时也是机器学习可解释性研究中的重要议题。

把场景具体化,让我们先来看这样一道选择题。

如果你是一个投资公司老板,针对电话诈骗检测,现在有一个可信度85%,但无法解释的“黑盒”模型,和一个可信度75%,但可解释的机器学习模型摆在你面前,你会选择哪一个?

但最初的最初,让我们先来理清这两个概念:自动机器学习与可解释机器学习。

理清概念

机器学习自动化(AutoML):让机器自己炼丹

王立威教授首先解释了什么是机器学习自动化。机器学习的应用需要大量的人工干预,比如特征提取、模型选择、参数调节等,深度学习也被戏称为炼丹术。

而AutoML 是试图将这些与特征、模型、优化、评价有关的重要步骤进行自动化地学习,实现从end to end 到learning to learn,使得机器学习模型无需人工干预即可被应用。让机器自己炼丹,让深度学习自动寻找最优框架。

使用AutoML,就像是在使用一个工具,我们只需要将训练数据集传入AutoML,那么这个工具就会自动帮我们生成参数和模型,形成训练模型,这样即使不具备机器学习方面深入的专业知识也可以进行机器学习方面的工作。

可解释机器学习(Explainable ML):信任之后人与机器才能更好地互动

随着AutoML学习模型的发展,机器学习的黑箱似乎在越来越大。这种缺乏解释的情况既是一个现实问题,也是一个伦理问题。所以近年,很多研究者呼吁我们需要可解释机器学习。

梅俏竹教授在解释XML的时候强调,辩题的核心还是在于AI和人的关系。我们大多同意未来的世界是AI与人共同合作,AI目前肯定还是做不到取代人。AutoML与XML其实并不矛盾,问题在于合作中如何人要如何达成对于AI的信任。

基于人工智能的结果越重要,对可解释人工智能的需求就越大。高风险的情况下,比如自动驾驶和医疗领域,人们可能需要明确地解释是如何得出特定结果的。而相对低风险的人工智能系统可能就更适合黑盒模型,人们很难理解其结果。

为什么说,机器学习中的可解释性很重要

追逐解释是人类的天性

场景问题是大家公认的导致可解释问题重要的一个原因。我们可以容忍机器没有理由地给我们错误推荐了一首不喜欢的歌,但是把重大的投资问题或者医疗建议交由机器决定的时候,我们希望可以得到充分的解释说明。

解释是跨多个行业和科学学科的负责任的、开放的数据科学的核心。

俞士纶教授提到对可解释人工智能的需求与人类的影响会同步上升,比如医生应用机器评估数据并得出决策数据,但是机器无法回答病人的疑问。以及在过滤假新闻的时候,机器在作出粗略判断和初步筛选之后,还是需要人类解释其中细微差别。

Clever Hans问题

Hans是一匹聪明的马,人们以为它会计算加法,因为有人说2+3的时候,它就会敲5下蹄子。但后来人们发现,它只是单纯地在敲蹄子,直到人们的表情发生改变就停下来。如果没有可解释性,任何人都无法保证高正确率模型其实只是另一匹Hans。

李兴建工程师说道,可解释也是企业实际应用非常关心的问题。如果人工智能系统出错,构建者需要理解为什么会这样做,这样才能改进和修复。如果他们的人工智能服务在黑盒中存在并运行,他们就无法了解如何调试和改进它。

可解释也许是一个伪命题

有些事情是无法解释,也不需要解释

但很有意思的事,解释可能无法穷尽。

王立威教授提出一个有趣的例子。机器作出判断,这是一只猫。如果我们要寻求解释,问为什么这是一只猫,机器可能回答,因为它有皮毛,有四只猫爪……我们再问,那为什么这是皮毛?

当然机器还可以继续解释,但是解释的结果可能会更加复杂,比直接告诉你这是皮毛要曲折得多。

人类大脑是非常有限的,而现在的数据太多了。我们没有那么多脑容量去研究所有东西的可解释性。世界上有那么多应用、网站,我们每天用 Facebook、Google 的时候,也不会想着去寻求它们背后的可解释性。

对于医疗行业的可解释机器学习的应用王立威教授也提出完全不同的想法,他认为只有在开始阶段,医生不够信任系统的时候可解释才重要。而当系统性能足够优化,可解释就不再重要。在不可解释上做的能超过人类,这就是未来机器学习的可为之处。

来自Geoffrey Hinton 的驳斥

Geoffrey Hinton 曾经大胆宣称,纠结深度学习(可与不可)解释性问题根本是一个伪命题。为什么一定要存在识别数字的理论才能证明我们擅长识别数字?难道非要通透骑车每一个细节的物理力学,才能证明自己会骑车?其实不是神经网络需要理论解释,而是人类克制不住自己讲故事的冲动,理论再合理也只是主观判断,并不能帮助我们理解为什么。

王立威教授表示赞同,以历史做类比。历史书上简单归纳出的胜败输赢难道就是真实的历史吗,不过是人类编造出的故事。真实的历史复杂,现实生活复杂,只言片语的解释和理论不过是管窥蠡测。

通过神经网络反思人的思维,同一个网络框架,初始点不同结果可能完全不同。解释可能会有两套截然不同的解释,就像对同一件事不同的人可能会有不同的解释。

一个人都无法完全理解另一个人,更何况与人的思维完全不同的机器?即使把alpha go下围棋中的所有数据告诉人也没有用,因为机器每一步的判断所用的数据是百万量级,而人最多处理到百的程度。就算打开黑匣,一千个人可能会看到一千种解释。

俞士纶教授认为Hinton的说法还是有些激进,解释不仅是为了说服,解释的形式和含义都非常之广,就算是autoML我们还是要朝着可解释的方向不断推进。

梅俏竹教授则认为单纯讨论autoML还是XML是没有意义的,就像我们判断autoML好不好,怎么算是一个好的推荐算法?如果机器中午十二点推荐你去吃午饭,的确它的准确率是百分之百,但是对于用户来说这是完全没有意义的一个推荐。评判需要加入人的因素进行考量,还是要看人机配合得怎么样,加入用户体验。

autoML的能耗问题:ACL论文痛批其捡芝麻丢西瓜

最近一份提交到自然语言处理顶会ACL 2019的论文引起热议,研究人员对几种常见的NLP模型进行碳排放评估后发现,像Transformer、GPT-2等流行的深度神经网络的训练过程可以排放超过62.6万磅的二氧化碳当量,几乎是美国汽车平均寿命期内排放量(包括制造过程)的五倍。

某些模型可能经过了千百次的训练之后取得最优成果,但是实际进展非常微小,而背后的代价是不成比例的计算量和碳排放。

李文钰提出业界现在的解决办法有比如共享参数、热启动,利用之前训练好的参数,避免再从头训练一个模型。

真正的autoML应该是在大型数据集上搜索,操作类型,拓扑结构,加上人的先验知识,未来希望找到又小又高效的好的模型。我们希望用机器代替节约人力,但是人也要去限制一些盲目搜索,节约成本的约束。

未来之路:炼金,观星,算命都不可取

几位教授最后都同意autoML和XML在未来是可以结合的。不管是autoML还是XML,现在还是在底层信号的层面运作,比如识别图像、文本,关键还是在知识层面,我们需要的是对整个网络结构更高层、更进一步的理解。

梅教授提出过犹不及,有三条走得太过的路是炼金、观星和算命。

炼金就是走极端的autoML之路。不要为了全自动就抛开所有代价去追求自动化,最后你也无法保证炼出来的是金子还是破铁;

观星,扩大范围,如果非要在一大堆的变量中拼命找联系,总能找寻到一二;

而算命的原理是找一些你愿意听的说,讲你爱听的故事,观星和算命都是在可解释的道路上走得太远。

最后的最后,梅教授也提醒大家,解释性可以解释部分问题,关于伦理,关于道德,但是它不是万能药。不要纠结于理解,为了理解而理解。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136230
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123899

原文标题:要强大的“黑匣子”,还是“可解释”的机器学习?| 清华AI Time激辩

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动化设备机器视觉检测光源产品的优势和劣势

    机器视觉光源,缺陷检测,自动化视觉检测机器视觉光源
    的头像 发表于 11-27 10:17 49次阅读
    <b class='flag-5'>自动化</b>设备<b class='flag-5'>机器</b>视觉检测光源产品的优势和劣势

    解锁智能制造新潜能:复合机器人“开箱即用”驱动检测自动化升级

    在智能制造不断深化的今天,传统单机自动化已难以满足多工序、跨工位的柔性生产需求。富唯智能推出的新一代复合机器人系统,凭借高度集成与智能协同能力,正在成为推动产线无人化、检测自动化的核心力量。本文将以实际应用为线索,剖析复合
    的头像 发表于 09-28 17:32 598次阅读
    解锁智能制造新潜能:复合<b class='flag-5'>机器</b>人“开箱即用”驱动检测<b class='flag-5'>自动化</b>升级

    富唯智能复合机器人力控技术:重新定义精准自动化

    在工业自动化和智能医疗快速发展的今天,富唯智能凭借先进的复合机器人力控技术,推出了新一代复合机器人解决方案。该方案深度融合协作机器人、自主移动机器
    的头像 发表于 08-26 16:54 562次阅读

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。
    发表于 07-26 11:22

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业
    的头像 发表于 07-15 16:32 527次阅读
    <b class='flag-5'>自动化</b>计算机的功能与用途

    Allegro创新电机驱动方案在工业自动化机器人中的应用

    电机作为工业自动化市场的支柱,其核心地位源于大多数应用均涉及运动或旋转场景。从机器人、传送系统到零件操纵器,从物料搬运设备、风扇到手臂工具、检测机器,再到线性运动执行器等,相关应用场景极为广泛。而这
    的头像 发表于 06-30 09:25 1405次阅读
    Allegro创新电机驱动方案在工业<b class='flag-5'>自动化</b>与<b class='flag-5'>机器</b>人中的应用

    机器人和自动化的未来(2)

    本文是第二届电力电子科普征文大赛的获奖作品,来自西南交通大学黄雯珂的投稿。3机器人与自动化的未来展望随着机器人和自动化技术的不断进步,未来的世界将会是一个高度
    的头像 发表于 04-26 08:33 588次阅读
    <b class='flag-5'>机器</b>人和<b class='flag-5'>自动化</b>的未来(2)

    高效解读机器语言,profinet转ethernet ip网关烟草企业自动化升级案例分析

    高效解读机器语言,profinet转ethernetip网关烟草自动化升级案例
    的头像 发表于 04-07 15:16 462次阅读
    高效解读<b class='flag-5'>机器</b>语言,profinet转ethernet ip网关烟草企业<b class='flag-5'>自动化</b>升级案例分析

    传感器在机器人和自动化领域的应用

    磁编码器与磁位置传感器是机器人与自动化技术发展的重要支柱,它们在精确控制、实时反馈和系统优化中扮演了不可或缺的角色。随着工业4.0和智能制造的蓬勃发展,机器人和自动化设备对运动精度、响
    的头像 发表于 03-06 16:17 1185次阅读

    工业自动化机器视觉技术的演变和未来发展趋势

    机器视觉是一项使机器或工业设备能够解释和分析视觉数据的技术,它将计算机科学与图像处理技术相结合,实现了自动化的视觉检查和分析。你也可以把它看作是一种赋予机器看到和理解周围环境的能力。
    的头像 发表于 03-06 11:39 1648次阅读
    工业<b class='flag-5'>自动化</b>中<b class='flag-5'>机器</b>视觉技术的演变和未来发展趋势

    它,机器人与HMI屏无缝对接

    导读随着工业自动化向智能发展,机器人与HMI屏的通信变得至关重要。本文将为您介绍一款创新的解决方案,它打破了通信协议的壁垒,实现机器人与HMI屏的无缝连接。随着工业
    的头像 发表于 02-17 11:39 727次阅读
    它,<b class='flag-5'>让</b><b class='flag-5'>机器</b>人与HMI屏无缝对接

    自动化设备装车机器人给饲料行业带来哪些优势

     自动化设备装车机器人:饲料行业的髙效变革  在饲料行业,传统的装车作业依赖大量人力,不仅效率低下,还容易出现人为误差和咹全隐患。随着科技的发展,自动化设备装车机器人的出现,为饲料行业
    的头像 发表于 02-07 15:53 767次阅读
    <b class='flag-5'>自动化</b>设备装车<b class='flag-5'>机器</b>人给饲料行业带来哪些优势

    全球的AI+EDA(电子设计自动化)创新项目

    for EDA 项目概述 :Google研究团队推出了AutoML自动化机器学习)平台,应用于电子设计自动化领域。该平台利用AI来
    的头像 发表于 02-07 12:00 3758次阅读

    罗克韦尔自动化推出DataReady智能机器

    作为工业自动化、信息和数字转型领域的全球领先企业之一, 罗克韦尔自动化宣布旗下 FactoryTalk Optix 产品组合再添新兵 -DataReady 智能
    的头像 发表于 12-31 14:42 1042次阅读

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    需要专业程序员进行繁琐的编程工作,这种方式不仅效率低下,还限制了机器人的应用场景。例如,在我们大学工程实训课程中使用的数控机床,需要人为设定起点、终点、移动方向和移动距离等参数,自动化程度非常有限。而
    发表于 12-29 23:04