0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一听说是黑盒系统就敬而远之是否是最好的做法?

jmiy_worldofai 来源:lp 2019-04-16 10:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一直以来大家都对深度学习这样的黑盒系统多有诟病,即便深度学习的可解释性方面已经有所建树,怀疑和抵制之声仍然很多。但CMU材料科学与工程系教授ElizabethA.Holm近期在《科学》杂志发表了一篇短评文章,少见地为黑盒系统给予一些肯定。这篇文章的视角也提醒我们重新考虑一下,一听说是黑盒系统就敬而远之是否是最好的做法。

曾经,科幻小说作家DouglasAdams假想人类建造出了有史以来最厉害的计算机,它的名字叫DeepThought,它上面运行的程序可以解答人类能够提出的最深刻的问题「生命的意义是什么」、「宇宙为什么存在」,以及其它所有问题。在计算了750万年以后,DeepThought给出了一个回答:数字「42」。随着人工智能系统已经开始进入所有人类努力探索的领域,包括科学、工程以及医疗保健,如今人类也必须面对DouglasAdams在这个故事里巧妙地隐含的问题:当我们不理解为什么会出现这个答案的时候,我们还有没有必要知道这个答案?一个黑盒系统到底好还是不好?

在我们学校大多数的物理科学和工学的教授同事们眼中,不使用深度学习这样的AI方法的最大原因就是他们不知道如何解释AI给出的答案是如何产生的。这个反对意见非常有力,其中隐含的顾虑可以包括实践、可以包括道德、甚至还可以包括法律。科学家们的使命、以及工程师们的职责都要求不仅仅能够预测会发生什么,还要理解它为什么会发生。一个工程师能够学会预测一座桥是否会倒塌,AI系统其实也可以学会做同样的事情,但只有工程师才能通过物理模型解释清楚他的决定是如何做出的,然后和别人沟通交流、让他们评价他的思路。假设有两座桥,人类工程师认为一座桥不会塌,AI认为另一座桥不会塌,那你会对哪一座桥更放心呢?

黑箱系统给出的答案无法完全令人信服的事情并不只发生在科学家和工程师身上。2018年提出的「欧盟一般数据保护条例」GDPR中就要求基于个人数据的自动决策系统能够为决策对象提供「对于涉及的决策逻辑的有意义的解释」。目前人们仍然在讨论这条要求如何在司法实践中落实,但是我们已经可以看到司法系统对于无法解释的系统的不信任。

在这种整个社会的怀疑氛围下,AI研究人员们的行动很好理解,他们不再公开宣扬黑盒决策系统,但他们展开更多研究,尝试更好地理解黑盒系统是如何做出决策的——这也就是我们常说的「可解释性」问题。实际上,这也是计算机科学领域当今最大的挑战之一。

不过,一刀切地拒绝所有的黑盒系统也许鲁莽了一点。在现实中,科学家和工程师们,作为人类、也和所有其他人一样地,根据自己已有的判断和经验做出决策,就好像是来自他们自己大脑中的「深度学习系统」。所以,脑神经科学也遇到了和计算机科学一样的可解释性挑战。然而,对于人类做出的决策、给出的结论,我们常常不加防备地直接接受,也不去试着完全了解它们的来源过程。这样说来,AI系统给出的答案也许值得考虑一下,它们也许也能发挥类似的益处;如果能确认的话,那我们还应该使用它们。

首当其中可以说的,也是最明显的,就是当错误答案带来的代价比正确答案带来的价值低很多的时候。定向广告投放就是一个典型的例子。从广告商的角度讲,投放了广告但是目标群体不想看的成本是很小的,但是成功的广告却能带来可观的收益。以我自己的研究领域,材料科学来说,图像分割任务通常都需要人类把材料图像中感兴趣的部分的复杂内部结构的边界手动勾画出来。这个过程成本很高,以至于不论是博士论文还是工业级的质量控制系统中一旦有需要图像分割的部分,都要让这部分所需的图像尽可能地少。如果换成AI系统,它就能很快完成大批量的图像分割任务,同时还具有很高的保真度(虽然并不完美)。在这里,完美的图像分割结果对于这些系统并不是必需的,因为出现那么一些误分类的像素的代价要比没有AI系统时研究生们付出的时间精力低太多了。

第二个可以使用黑盒系统的例子也很明显,不过要更有活力一些。如果一个黑盒系统能产生最佳的结果,那我们就应当使用它。比如,在评估标准的平面医学影像时,经过训练的AI系统可以帮助人类影像科医生得到更准确的癌症评估结果。虽然这种情况下出现一个错误答案(不论是假正例还是假负例)的代价并不低,但在黑盒系统的帮助下我们可以达到其它任何方案都无法达到的高准确率,这就成为了当前最佳的解决方案。当然了,有人会说让AI看X光片本来就可以接受,部分原因是因为总会有人类医生检查AI给出的结果;让AI开车就会让人有更多顾虑,因为这个黑盒系统做出的决策能影响人的生死,但同时它却没有给人类留出干预的机会。即便这样,自动驾驶汽车也总有一天会比人类驾驶的汽车更安全,它们将会在事故率和死亡率上都做得比人类司机更好。如果取一些合理的指标来衡量,那么那一天一旦到来我们马上就会知道,但是是否让人类司机让位给AI司机会是整个社会的决定,需要考虑到人类道德观念、公平性、非人类实体的追责等许多方面。

但是需要说明的是,我们能列出这些情况并不代表黑盒模型在这些场景中就直接得到许可了。在上面两种情况中我们都假设了一个理想的黑盒子,有人对它的运行负责,而且能够它的代价,或者能够明确无误地定义什么是最好的结果。这两个假设都有落入误区的可能。AI系统可能会有一系列的缺点,包括偏倚、在训练的领域外不适用、脆弱性(很容易被欺骗)。更重要的是,评估代价和最佳结果是一个复杂的决策问题,需要在经济性、个体需求、社会文化、道德考量等许多方面之中做出权衡。更糟糕的是,这些因素可能是一环套一环的:一个有偏倚的模型可能会隐含着一些代价,可以表现为模型自己做出错的预测,也可以表现为外人对模型的公平性的评估不准确。一个脆弱的模型可能会包含一些盲点,在某些时候会产生错的离谱的糟糕决定。就像面对任何决策系统一样,使用黑盒系统的时候仍然要配合知识、判断力和责任心。

根据定义,人类无法解释一个黑盒算法是如何给出某个具体的答案的。但是,当黑盒系统能够带来最佳的产出,或者给出错误答案的代价很小,或者能够启发新的思维的时候,它们仍然可以为我们带来价值。

虽然AI的思考过程是带有限制的、可能包含偏倚甚至可能直接就是错误的,但它们毕竟和人类的思考方式有很大的区别,有可能可以揭示新的联系和新的方法。这样一来,黑盒系统就有了第三种可以使用的场景:作为引导人类思考和质疑的工具。比如在某项突破性的医学影像研究中,科学家们训练了一个深度学习系统来根据眼部照片诊断糖尿病性视网膜病变,得到的结果能够近似或者超过一组眼科专家的表现。更令人惊奇的是,这个系统还可以一并分析得出眼科诊断中不会涉及的别的信息,包括心脏病风险高低、年龄、性别等等。在此之前从来没有人注意过不同性别的视网膜之间会有什么区别,所以这个黑盒子系统的发现就给科研人员们提供了新的线索,可以进一步探究不同性别的视网膜之间到底有何区别。对于这些引发的问题的研究也就不再继续属于可解释的AI系统以及人类智慧的黑盒系统领域。

说了一圈,我们可以再来看看一开始提到的DeepThought给出的答案「42」。我们没法用黑盒AI系统寻找因果关系、构建知识和逻辑系统以及达成理解,一个黑盒系统也没办法告诉我们桥为什么会塌、生命和宇宙的种种问题的答案是什么、以及解释世间的一切。至少目前,这些问题都属于人类智慧和逐渐发展的可解释AI的领域。但同时,我们也仍然可以用适当的方式接受黑盒系统。黑盒系统可以对科学、技术、工程、数学等等领域产生潜在且正面的影响,可以产生价值、优化结果以及启发创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 黑盒
    +关注

    关注

    0

    文章

    5

    浏览量

    8186
  • 人工智能系统

    关注

    0

    文章

    39

    浏览量

    10842
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123929

原文标题:不要一棍子打翻所有黑盒模型,其实可以让它们发挥作用

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    音质向——CD7377CZ vs CD7388 感实测:不同曲风下的表现差异

    对发烧友而言,功放芯片的最终价值体现在感上。今天用同套音响系统(前声场:丹拿232 4Ω、后声场:JBL CLUB 9630 8Ω、低音炮:Kicker CVR12 2Ω),分别搭配
    发表于 12-11 11:00

    宽带功率放大器在光纤水器的动态压力测试中的应用

    的性能指标,实验中围绕功率放大器搭建测试系统,检测其对静态和动态压力响应,旨在为光纤水器技术发展提供有价值的研究成果。 安泰电子ATA-1200C宽带放大器,其最大输出电压30Vpp,带宽范围DC~25MHz并具有低失真、高稳定的特点,为
    的头像 发表于 12-03 16:51 473次阅读
    宽带功率放大器在光纤水<b class='flag-5'>听</b>器的动态压力测试中的应用

    爱华aiwa HS-JX849磁带机随身维修手册

    爱华aiwa HS-JX849磁带机随身维修手册
    发表于 12-01 16:57 0次下载

    广州邮科PCM综合设备是啥?文带你搞懂它的“神操作”!

    嘿,各位搞通信、做弱电、或者正在为单位搭建内部通信系统的朋友们,今天咱们来聊个硬核但超实用的话题—— 广州邮科PCM综合设备 。别一听名字就头大,什么“PCM”、“复用设备”,听着像天书?别急,咱
    的头像 发表于 10-25 09:31 357次阅读
    广州邮科PCM综合设备是啥?<b class='flag-5'>一</b>文带你搞懂它的“神操作”!

    基于优化算法的黑盒系统验证策略

    自动驾驶的安全验证是保证系统在给定环境中正确及安全操作的过程。系统的期望行为通过某些规范标准来定义,而系统失败指其行为违反了这些规定。
    的头像 发表于 10-16 10:32 350次阅读
    基于优化算法的<b class='flag-5'>黑盒</b><b class='flag-5'>系统</b>验证策略

    功率放大器测试解决方案分享——光纤水器动态压力测试

    功率放大器测试解决方案分享——光纤水器动态压力测试
    的头像 发表于 10-10 18:34 324次阅读
    功率放大器测试解决方案分享——光纤水<b class='flag-5'>听</b>器动态压力测试

    香港立法会与科大讯飞联合打造智慧誊录系统“智识

    香港立法会主席梁君彦在社交平台发文点赞的“智识系统,是香港立法会与科大讯飞联合打造的智慧誊录系统
    的头像 发表于 08-11 14:45 1374次阅读

    MEMS矢量水器敏感结构的后CMOS释放工艺研究

    MEMS矢量水器敏感结构的后CMOS释放工艺研究
    发表于 07-24 15:08 0次下载

    防雷浪涌保护器是否定安全

    、防雷浪涌保护器是否绝对安全? 防雷浪涌保护器(SPD,Surge Protective Device)是现代电力系统和弱电系统中不可或缺的防护设备,主要用于限制雷击或操作引起的瞬态
    的头像 发表于 07-21 14:46 455次阅读
    防雷浪涌保护器<b class='flag-5'>是否</b><b class='flag-5'>一</b>定安全

    松下 rq-sx3随身电路图资料

    松下 rq-sx3随身电路图
    发表于 07-11 15:40 4次下载

    索尼-EJ1000 CD随身电路原图资料

    索尼-EJ1000 CD随身电路原图图
    发表于 06-24 16:57 5次下载

    双路服务器和单路服务器区别有多大?用实际应用场景对比文讲透

    在服务器采购和部署的过程中,我们经常听到“单路服务器”和“双路服务器”这两个概念。乍一听好像就差个“处理器插槽”,但实际用起来,区别还真不小。作为个在服务器领域摸爬滚打多年的从业者,小颉今天就从
    的头像 发表于 05-22 15:53 1495次阅读
    双路服务器和单路服务器区别有多大?用实际应用场景对比<b class='flag-5'>一</b>文讲透

    如何破解GPU集群集合通信路径的“黑盒”难题?

    集合通信库(如NCCL、HCCL)的运行细节用户完全无感知,形成“黑盒”状态。EPS通过实时解析集合通信库的底层运行状态,将隐蔽的通信路径、GPU与网卡状态等信息可视化,并提供智能路由推荐,帮助用户快速优化集群性能。
    的头像 发表于 05-22 10:13 728次阅读
    如何破解GPU集群集合通信路径的“<b class='flag-5'>黑盒</b>”难题?

    如何判断个软启动器是否故障

    软启动器是否故障,可以通过以下几种方法: 、基本检查 1. 外观检查:    ● 检查软启动器的外壳是否完整,有无损坏或变形。    ● 检查连接电缆和插头是否松动或损坏。 2. 电
    的头像 发表于 04-10 07:34 1609次阅读
    如何判断<b class='flag-5'>一</b>个软启动器<b class='flag-5'>是否</b>故障

    中科芯:科技之光温暖障人群

    树立行业标杆,讲好中国故事,传递中国声音,充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。近日,“崛起的民族品牌”专题系列节目对话天津中科芯科技有限公司(简称:中科芯)的创始人兼总经理
    的头像 发表于 01-13 10:54 854次阅读
    中科<b class='flag-5'>听</b>芯:科技之光温暖<b class='flag-5'>听</b>障人群