0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习研究中的四大危机是什么?

DPVg_AI_era 来源:未知 作者:李倩 2018-07-14 09:15 次阅读

近期,来自CMU和斯坦福的Zachary C. Lipton和Jacob Steinhardt两位研究员为顶会ICML举办的Machine Learning: The Great Debate发表文章,并指出现在机器学习研究中的四大危机:混淆阐述与推测、无法明确得到较好结果的原因、数学公式堆积以及语言误用。

学术界在大家的印象里一般是很严肃的,但近期AI顶会ICML在斯德哥尔摩举办了一个辩论会—Machine Learning: The Great Debates (ML-GD),专供各家学者、研究人员积极探讨领域内技术的现状、瓶颈及对社会的影响。

有AI小网红之称的Zachary C.Lipton携手斯坦福研究员Jacob Steinhardt发表了参会的论文《Troubling Trends in Machine Learning Scholarship》,并发推文,引发了热烈的讨论。

观点提出背景

机器学习(ML)研究人员正在致力于有关“数据驱动算法”知识的创建和传播。据研究,许多研究人员都渴望实现以下目标:

理论性阐述可学习内容

深入理解经验严谨的实验

构建一个有高预测精度的工作系统

虽然确定哪些知识值得探究是很主观的,但是一旦主题确定,当论文为读者服务时,它对社区最有价值,它能创造基础知识并尽可能清楚地进行阐述。

什么样的论文更适合读者呢?我们可以列出如下特征:这些论文应该

(i)提供直观感受以帮助读者理解,但应明确区别于已证明的强有力结论;

(ii)阐述考量和排除其他假设的实证调查 ;

(iii)明确理论分析与直觉或经验之间的关系 ;

(iv)利用语言帮助读者理解,选择术语以避免误解或未经证实的内容,避免与其他定义冲突,或与其他相关但不同的概念混淆。

机器学习研究中的四大危机

尽管机器学习最近取得了一些进展,但这些“理想”状态往往与现实背离。在这篇文章中,我们将重点放在以下四种模式上,这些模式在ML学术(schoolar-ship)中似乎是最流行的:

1. 无法区分客观阐述和推测。

2. 无法确定得到较好结果的原因,例如,当实际上是因为对超参数微调而获得好效果的时候,却强调不必要修改神经网络结构。

3. 数学公式堆积:使用令人混淆的数学术语而不加以澄清,例如混淆技术与非技术概念。

4. 语言误用,例如,使用带有口语的艺术术语,或者过多的使用既定的技术术语。

虽然这些模式背后的原因是不确定的,但会导致社区的迅速扩张、评阅的人数不足,以及学术和短期成功衡量标准(如文献数量、关注度、创业机会)之间经常出现的不平衡。虽然每种模式都提供了相应的补救措施(但不建议这么做),我们还将讨论一些关于社区如何应对这些趋势的推测性建议。

有缺陷的学术研究可能会误导大众,并阻碍学术未来的研究。实际上,这些问题有许多是在人工智能的历史(更广泛地说,是在科学研究)中循环出现的。1976年,Drew Mc-Dermott[1]指责人工智能社区放弃了自律,并预言“如果我们不能批判自己,别人就会帮我们解决问题”。

类似的讨论在整个80年代、90年代和2008年都反复出现[2,3,4]。在心理学等其他领域,糟糕的实验标准削弱了人们对该学科权威的信任。当今机器学习的强劲潮流归功于迄今为止大量严谨的研究,包括理论研究[5,6,7]和实证研究[8,9,10]。通过提高清晰明了的科学思维和交流,我们可以维持社区目前所享有的信任和投资。

总结

可能有人会认为这些问题可以通过自律、自我纠正来改善。这个观点虽然是正确的,但是机器学习社区需要反复讨论如何构建合理的学术标准以实现这种自我修正。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43796

    浏览量

    230570
  • 机器学习
    +关注

    关注

    66

    文章

    8112

    浏览量

    130545

原文标题:【ICML开杠】机器学习研究的四大危机

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    EMC 四大设计技巧

    本帖最后由 eehome 于 2013-1-5 09:54 编辑 EMC 四大设计技巧
    发表于 08-17 16:09

    工程师手记:FPGA学习四大误区

    工程师手记:FPGA学习四大误区
    发表于 08-17 23:47

    对于cadence PCB/SCH/SI/PI四大功能的学习,求实例

    对于cadence PCB/SCH/SI/PI四大功能的学习,各位大神有没有什么简单的例子可以给我·····需要做个报告,又不懂···求教求教
    发表于 11-22 13:27

    工业机器人的四大核心部件

    `工业机器人的核心部件包括机器人本体、减速器、伺服电机、控制系统等四大部分,这4部分分别占总成本的22%、24%、36%、12%。   笔者从中国国际机器人展览会上了解到,目前新时达(
    发表于 02-12 10:17

    工业机器人与金属成形机床集成的四大应用

    工业机器人与金属成形机床集成的四大应用 近年来,随着我国制造业转型升级压力增加和劳动力成本的不断攀升,越来越多的企业考虑以机器人换人。上海、南京、芜湖、沈阳、天津、青岛、重庆等地已陆续建立了工业
    发表于 12-04 15:01

    有没有搞机器学习算法研究的啊?

    有没有搞机器学习、人工智能相关的算法研究的啊?自己一个人搞感觉挺难的,希望找到志同道合的朋友,相互探讨。
    发表于 02-26 09:56

    【下载】《机器学习》+《机器学习实战》

    强化学习等.下载链接:[hide][/hide]2.机器学习实战简介:机器学习是人工智能研究领域
    发表于 06-01 15:49

    我这里有机器四大家族的行业资料,等你免费来领取!

    `我这里有机器四大家族的行业资料,等你免费来领取!都是我最新刚找出来的我的微信ck1108_`
    发表于 11-13 13:12

    机器四大家族抢滩中国市场 地方***重点发力

    今年上半年,上海制造业投资同比增长22%,出现了近年未有的两位数增长。其中,颇具代表性的是机器人产业。在刚结束的进博会上,机器人巨头企业收获满满。目前,四大机器人家族
    发表于 11-21 18:11

    什么是PCB射频电路四大基础?

    什么是PCB射频电路四大基础?在PCB设计过程需要特别注意的重要因素有哪些?
    发表于 08-21 06:22

    如果只是应用机器学习,而不是研究,需要哪些知识

    如果只是应用机器学习,而不是研究,需要哪些知识?还用深入学习数字么
    发表于 08-30 14:51

    【瑞芯微RK1808计算棒试用申请】基于机器学习的视觉机械臂研究与设计

    项目名称:基于机器学习的视觉机械臂研究与设计试用计划:申请理由本人在深度学习领域有年开发经验,申请理由:基于视觉的机械臂伺服控制系统,并根
    发表于 09-23 15:39

    机器人的机构设计

    机器人属于复杂机电系统,需要综合生物、机械、电子、控制等学科内容,具体涉及仿生机构设计、灵巧运动机构设计、高性能驱动器制造,行走稳定性控制、强化学习等在内的多个研究方向。其中,机构
    发表于 09-15 06:54

    值得研究四大机器学习策略分析

    机器学习有四种广受认可的形式:监督式、无监督式、半监督式和强化式。在研究文献中,这些形式得到了深入的探讨。它们也被纳入了大多数机器学习算法的
    发表于 11-14 10:17 1548次阅读

    应对危机四大移动技术战略的PDF文件讲解

    应对危机四大移动技术战略的PDF文件讲解
    发表于 12-01 00:25 15次下载