0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度学习比较火热的情景下需要避免的三个坑

MqC7_CAAI_1981 来源:未知 作者:李倩 2018-08-15 14:18 次阅读

本文是人工智能专家George Seif撰写的博文,介绍了在当前深度学习比较火热的情景下需要避免的三个坑。

Tweaking Neural Net Parameters

Three reasons that you should NOT use deep learning

深度学习在过去几年一直是人工智能领域最热门的话题。事实上,正是它激发了科学家、政府、大公司以及其他所有人对人工智能的极大新兴趣!这是一门很酷的科学,具有潜在的巨大的实用性和积极的应用。它正被用于金融、工程、娱乐、消费产品和服务等领域。

但是,所有应用都需要使用到深度学习吗?当我们开展一个新的项目时,我们需要不自觉地一开始就使用深度学习吗?

在有些情况下,使用深度学习是不合适的,我们需要选择一些别的方案。让我们来探讨一下这些情况吧。

(1)深度学习不适用于小数据集

为了获得高性能,深度网络需要非常大的数据集。标注的数据越多,模型的性能就越好。获得标注良好的数据既昂贵又耗时。雇佣人工手动收集图片并标记它们根本没有效率可言。在深度学习时代,数据无疑是最有价值的资源。

最新的研究表明,实现高性能的网络通常需要经过数十万甚至数百万样本的训练。对于许多应用来说,这样大的数据集并不容易获得,并且获取成本高且耗时。对于较小的数据集,传统的ML算法(如回归、随机森林和支持向量机)通常优于深度网络。

(2)深度学习运用于实践是困难且昂贵的

深度学习仍然是一项非常尖端的技术。您可以像许多人一样获得快速简便的解决方案,特别是使用广泛使用的API,例如Clarifai和Google的AutoML。但如果你想做一些定制化的事情,这样的一些服务是不够的。除非你愿意把钱花在研究上,否则你就会局限于做一些和其他人稍微相似的事情。

这也是很昂贵,不仅是因为需要获取数据和计算能力所需的资源,还因为需要雇佣研究人员。深度学习研究现在非常热门,所以这三项费用都非常昂贵。当你做一些定制化的事情时,你会花费大量的时间去尝试和打破常规。

(3)深层网络不易解释

深层网络就像是一个“黑盒子”,即使到现在,研究人员也不能完全理解深层网络的“内部”。深层网络具有很高的预测能力,但可解释性较低。由于缺乏理论基础,超参数和网络设计也是一个很大的挑战。

虽然最近有许多工具,如显著性映射(saliencymaps)和激活差异(activation differences),它们在某些领域非常有效,但它们并不能完全适用于所有应用程序。这些工具的设计主要用于确保您的网络不会过度拟合数据,或者将重点放在虚假的特定特性上。仍然很难将每个特征的重要性解释为深层网络的整体决策。

另一方面,经典的ML算法,如回归或随机森林,由于涉及到直接的特征工程,就很容易解释和理解。此外,调优超参数和修改模型设计的过程也更加简单,因为我们对数据和底层算法有了更深入的了解。当必须将网络的结果翻译并交付给公众或非技术受众时,这些内容尤其重要。我们不能仅仅说“我们卖了那只股票”或“我们在那个病人身上用了这药”是因为我们的深层网络是这么说的,我们需要知道为什么。不幸的是,到目前为止,我们所掌握的关于深度学习的所有证据或者解释都是经验主义的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43824

    浏览量

    230574
  • 深度学习
    +关注

    关注

    73

    文章

    5236

    浏览量

    119896

原文标题:深度学习并非万能:你需要避免这三个坑

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    简单的三个数大小比较C程序

    今日重学谭老师编著的C程序设计,问到比较三个数大小的时候,自己写了一程序,感觉挺对的,可就是运行结果不对,我的程序如下: #includevoid main(){int a,b,c,max
    发表于 02-04 23:21

    stm32 三个文件夹学习小结

    stm32 三个文件夹学习小结,包括自己对寄存器,时钟,简单的编程思想的理解。可能你自己看过了三个文件夹,再看看这个东西,会有一点帮助。半年前写的,高手勿喷。不好意思刚才忘记添加附件了。。。
    发表于 09-01 14:54

    学习hadoop需要什么基础

    可能就是“会不难”哦! 当你看了很多介绍“学习hadoop需要什么基础”的文章后,你一定会得出一结论,那就是学习hadoop所必须的三个
    发表于 09-13 13:37

    主流深度学习框架比较

    DL:主流深度学习框架多个方向PK比较
    发表于 12-26 11:10

    DSP学习三个方面

    个人认为,对DSP的学习,主要有三个方面:1)芯片的外设的使用,同时学习软件开发环境;2)DSP的内核结构与汇编指令;3)DSP算法的移植和优化工作。 第一部分:芯片的使用  学习哪些
    发表于 02-28 14:53

    AI工程师 10 深度学习方法

    的同一神经元的循环连接(与前一层的连接除外)。因此,深度学习可以被定义为以下四基本网络框架中具有大量参数和层数的神经网络:无监督预训练网络卷积神经网络循环神经网络递归神经网络在这篇文章中,我主要讨论
    发表于 03-07 20:17

    labview实现深度学习,还在用python?

    如何使用labview实现深度学习应用。ok样本ng样本这些图片的特征是:ok与ok,ng与ng之间都有差异,传统的方法要实现,就需要复杂的算法编程实现,如果用深度
    发表于 07-23 20:33

    labview测试tensorflow深度学习SSD模型识别物体

    安装labview2019 vision,自带深度学习推理工具,支持tensorflow模型。配置好pythontensorflow环境配置好object_detection API下载SSD模型
    发表于 08-16 17:21

    labview深度学习应用于缺陷检测

    标注产品后通过训练平台完成模型训练经过少量样品训练得到测试结果,表明深度学习对传统视觉算法比较棘手的缺陷检测方面,能简单粗暴的解决问题,后续就是增加缺陷样品的收集,标注,以及模型的训练。龙哥手把手教
    发表于 08-16 18:12

    梓回收连接器公司 梓收购光耦IC火热回收

    `梓回收连接器公司 梓收购光耦IC火热回收 18899-854-850深圳蓝微兴是一家有经验,有实力的电子元件回收公司。长期本着‘价格合理、专业热情、诚信守时、现金支付’的经营理念。个人/工厂
    发表于 09-24 10:36

    嵌入式学习步骤的三个阶段

    [嵌入式系统无疑是当前国内最热门的技术之一,但是该如何来学好嵌入式系统?好的学习方法是前提,但正确的学习步骤依然不可缺少,分享一比较主流的嵌入式
    发表于 01-14 07:25

    请问一什么是深度学习

    请问一什么是深度学习
    发表于 08-30 07:35

    什么是深度学习?使用FPGA进行深度学习的好处?

    FPGA实现。易于适应新的神经网络结构深度学习是一非常活跃的研究领域,每天都在设计新的 DNN。其中许多结合了现有的标准计算,但有些需要全新的计算方法。特别是在具有特殊结构的网络难以
    发表于 02-17 16:56

    如何区分深度学习与机器学习

    深度学习与传统的机器学习最主要的区别在于随着数据规模的增加其性能也不断增长。当数据很少时,深度学习算法的性能并不好。这是因为
    发表于 10-27 16:50 1744次阅读
    如何区分<b class='flag-5'>深度</b><b class='flag-5'>学习</b>与机器<b class='flag-5'>学习</b>

    在当前深度学习比较火热情景需要避免三个

    深度学习在过去几年一直是人工智能领域最热门的话题。事实上,正是它激发了科学家、政府、大公司以及其他所有人对人工智能的极大新兴趣!这是一门很酷的科学,具有潜在的巨大的实用性和积极的应用。它正被用于金融、工程、娱乐、消费产品和服务等领域。
    的头像 发表于 08-17 17:16 3025次阅读