0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ICML 2019的评审结果已经出来了,你们提交代码了吗?

电子工程师 来源:lp 2019-03-12 14:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日微软研究的 John Langford 讨论了顶会到底应不应该提交代码,因为不同研究主题与领域对代码的需求不同,他表明代码提交应该鼓励,但并不能强制。作为 ICML 2019 的程序主席,Russ Salakhutdinov 表示他赞成 John Langford 的观点,他们在 ICML 2019 的评审中也引入了代码提交的选项。目前 ICML 2019 的评审结果已经出来了,那么你们提交代码了吗?

ICML、ICLR 和 NeurIPS 都在尝试将实验代码和数据作为评审材料的一部分提交,它们鼓励作者在评审或出版过程中提交代码以帮助结果可复现。目前,研究结果的可复现性通过论文、workshop 和演讲得到了很多讨论,也受到越来越多的关注。

最基本的驱动因素当然是目前的研究结果缺少可复现性,很多优秀研究都没有提供对应的代码。对任何评审和出版来说,可复现性的缺失是一个严肃的问题。因为后来的研究者会基于先驱工作做一些新的东西,缺乏可复现性将有碍这一过程。

其实由于随机初始化等机制缺乏可复现性,早期的神经网络研究并不受欢迎。虽然,目前证明神经网络的表征能力十分强大,但可复现性问题仍然存在。此外,研究中我们总会潜在怀疑前沿工作的结果是有一些水分,而提供可复现的代码能在一定程度上排除这样的质疑。

有了上面的观点,John Langford 表明可复现性的支持者应该将其理解为一个重要的属性,但并不是唯一的属性。例如,我们相信即使研究结果很难复现,但社区也能看到 AlphaGoZero 的发布。对于研究社区而言,真正有价值的是展示什么是可能的,而不是展示将围棋代码应用到另一种游戏的可能性。真正有价值的是展示算法更多的可能性,尽管它可能连代码都没有发布。如果我们将可复现性作为绝对价值,那么我们很可能就错过了这样的研究成果。

一个重要的观念是,机器学习至少有三种研究:

算法:这种研究的目标是发现一些更好的算法以解决各种学习问题,这是顶会上最典型的类型。

理论:该研究的目标是一般性地理解哪些学习算法是可能的,哪些是不可能的。虽然这些论文同样可能提出算法,但它们通常并不要求一定要实现,这会浪费作者、评审者和读者的时间。

应用:这一些研究的目标是解决特定的任务。AlphaGoZero 就是一个合理的例子,它在围棋上用算法击败了世界冠军。对于这类研究而言,由于计算量大、数据所有权等特点,编程的可复现性可能不切实际。

如果使用一种「放之四海皆准」的策略,要求每一篇论文都是可编程复现的,这种错误会降低研究社区的活力与创新。保证这三方面的研究的基本需求,将丰富社区的各种新思想。

如果我们从更广泛的角度来考虑这个论点,你是否希望医疗健康条例以所有科学研究为基础,包括那些不公开的数据?还是希望只以公共医疗领域的数据为基础?后者等价于忽略大多数科学研究,只针对特定领域做决策会有更好的效果。

强制方法的替代是将代码作为补充资料,附加材料在变化的评审过程中也能很好地追踪、记录。

在以前做机器学习研究时,论文不是双盲的。社区因为评审公正性开始使用双盲机制,无论是什么资历的作者和论文都能被公平评审。同时社区并不限制论文在发布前公布到 arXiv 上或者公开讨论,因为这会降低作者的研究效率。双盲评审社区可能有不同观念,但在 ML 领域这么做并没分歧。

在以前做机器学习研究时,提交论文的页数也有强制限制。对理论论文而言,证明部分不包括在内。我们后来改变了评审流程,允许(不要求)提交附录,便于评审使用。这为作者/评审增加了更多选择,获得了所有人的支持。

说到复现,我们能为社区做什么?

如果评审能够拿到底层代码或者数据,是否能更好地做评审工作?

开放代码对作者有好处吗?

开发代码对读者有好处吗?

如果准确无误,答案无疑是「yes」。

对评审而言,不为他们添加负担非常重要。评审可能缺乏计算资源、平台或者个人时间,无法完全复现论文结果。因此,我们应该像附录那样查看代码(和数据)提交,便于评审探究和使用。

对作者而言,放出代码有两个好处:提供额外的方法,说服善于质疑的评审;促进后续的工作也这么做,很多高引用量的论文都开放了源代码。当然,许多情况下不太可能放出代码或者对作者没好处。例如一篇理论论文,很可能算法不是重点,或者因为数据所有权,代码并不能完全公开。从此来看,我们应该有选择的支持、鼓励开放代码。

对读者而言,附加代码(和数据)明显增加了一篇论文的深度价值。一些读者可能用不到,但一些会用到(代码),在许多情况下这能极大的降低使用该论文的壁垒。

鼓励研究者添加附加实现,这也是 ICML2019 程序主席 Kamalika Chaudhuri 和 Ruslan Salakhutdinov 今年的策略。

除了鼓励外,我们需要进一步强制代码提交吗?考虑到一篇论文是否应该发布,持怀疑态度的审稿人肯定可以将可重复性的价值与其他价值进行权衡。因此有需要的话可以有附加代码,但强制代替提交却会降低其它价值。

我们应该少添加一些附加材料吗?我看不到理由:附加的方法能纯粹改进作者/评审/发布流程。不是每个人都能够利用这些好处,但限制其他人利用这些好处就很不合情理了。

最后值得一提的是,今年 ICML 的代码提交流程是个尝试。我们希望所有的程序主席能够作此尝试,因为这是改进的开始。我们应该尽全力尝试这样的工作,评估得失,预期明年的调整。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4840

    浏览量

    108141
  • 代码
    +关注

    关注

    30

    文章

    4975

    浏览量

    74349
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208

原文标题:顶会论文应不应该提交代码?应该,但不能强制

文章出处:【微信号:aicapital,微信公众号:全球人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国星光电参与项目荣获神农中华农业科技奖二等奖

    近日,中国农学会公布2022-2023年度神农中华农业科技奖评审结果,国星光电参与的“设施作物高效种植LED关键技术创新与应用”项目荣获神农中华农业科技奖科学研究类成果二等奖。
    的头像 发表于 02-04 09:36 381次阅读

    芯原入选国家知识产权示范企业创建对象

    1月12日,国家知识产权局公示了“2025-2027年国家知识产权强国建设示范创建对象”的评审结果,芯原微电子 (上海) 股份有限公司凭借其在知识产权创造、运用、管理和保护方面的扎实基础与突出成效,成功入选“国家知识产权示范企业创建对象”,这标志着公司知识产权工作获得了国家层面的权威认可。
    的头像 发表于 01-27 15:28 324次阅读

    基于知识工程JoyAgent双RAG的智能代码评审系统的探索与实践

    大促备战中的代码评审困境与破局 双十一大促是系统稳定性的终极“大考”。为规避上线风险,技术侧会启动系统封板管控,主动将非紧急需求的发布窗口前置。这一举措在保障系统稳定性的同时,也必然导致研发需求
    的头像 发表于 01-21 18:26 2287次阅读
    基于知识工程JoyAgent双RAG的智能<b class='flag-5'>代码</b><b class='flag-5'>评审</b>系统的探索与实践

    帝奥微成功入选国家知识产权示范企业

    近日,国家知识产权局正式发布《关于国家知识产权强国建设示范创建对象评审结果的公示》,帝奥微凭借完善的知识产权管理体系以及显著的成果转化成效,成功入选“国家知识产权示范企业”!
    的头像 发表于 01-19 16:34 939次阅读

    基于知识工程&amp;JoyAgent双RAG的智能代码评审系统的探索与实践

    大促备战中的代码评审困境与破局 双十一大促是系统稳定性的终极“大考”。为规避上线风险,技术侧会启动系统封板管控,主动将非紧急需求的发布窗口前置。这一举措在保障系统稳定性的同时,也必然导致研发需求
    的头像 发表于 01-15 15:12 304次阅读
    基于知识工程&amp;JoyAgent双RAG的智能<b class='flag-5'>代码</b><b class='flag-5'>评审</b>系统的探索与实践

    广汽L4 Robotaxi获评十五运会和残特奥会粤港澳协同发展典型案例

    近日,十五运会和残特奥会粤港澳协同发展典型案例征集评审结果正式公示。广汽集团报送的“智慧全运、科技领航:如祺出行助力广州推出全球首款L4级自动驾驶赛事服务车队应用案例”获评为典型案例,是唯一入选的自动驾驶服务案例。
    的头像 发表于 12-18 15:18 594次阅读

    发布元服务提交审核

    完成所有应用信息和版本信息的配置后,可将元服务提交至华为方进行发布审核。 登录AppGallery Connect,点击“APP与元服务”。 选择要发布的元服务。 左侧导航选择“应用上架 &
    发表于 12-04 14:23

    飞谱电子荣获2024年度民营科技发展贡献奖

    近日,中国民营科技促进会正式公示“2024年度民营科技发展贡献奖”评审结果,无锡飞谱电子信息技术有限公司凭借在电磁仿真领域的技术突破、产业贡献及创新实力,成功斩获此项殊荣,成为国产CAE/EDA行业自主创新的标杆代表。
    的头像 发表于 09-30 11:09 1199次阅读

    企业和个人基于业务知识和代码库增强的大模型生成代码实践

    :“这个功能之前做过类似的,你参考下历史代码。”可当他打开代码仓库,却发现注释寥寥,变量名像密码一样难懂,更找不到任何需求文档。他硬着头皮修改,结果上线后引发了线上故障——原来有个隐藏的业务规则,只有老员工才知道。 第二周:
    的头像 发表于 07-08 15:31 519次阅读
    企业和个人基于业务知识和<b class='flag-5'>代码</b>库增强的大模型生成<b class='flag-5'>代码</b>实践

    ReviewHub:助力设计与质量部门无缝协同,实现评审模式升级

    在电子产品设计与质量管理中,跨部门的高效评审协作至关重要。随着技术的发展,评审方式也经历了多代演变,ReviewHub以其创新的“无缝链接”方案,全面提升了设计与质量评审的协同效率和管理水平。三代
    的头像 发表于 06-17 11:33 753次阅读
    ReviewHub:助力设计与质量部门无缝协同,实现<b class='flag-5'>评审</b>模式升级

    所以你做出来了吗

    所以你做出来了吗,求
    发表于 06-16 01:43

    如何优化您的PCB设计评审流程

    印刷电路板(PCB)设计评审是在产品开发的各个阶段检查电路板设计中潜在错误和问题的重要环节。其形式既可以是需要正式签字确认的清单式评审,也可以是对原理图和 PCB 布局的自由式检查。
    的头像 发表于 06-04 14:08 1557次阅读
    如何优化您的PCB设计<b class='flag-5'>评审</b>流程

    ReviewHub:实现Booster与设计工具端无缝链接的评审协作平台

    在电子产品设计与质量管理中,跨部门的高效评审协作至关重要。传统线下评审方式因时间、地点和信息孤岛等限制,效率低下且易出错。ReviewHub作为一款贯穿Booster与设计工具端的线上评审平台,凭借
    的头像 发表于 06-04 11:46 976次阅读
    ReviewHub:实现Booster与设计工具端无缝链接的<b class='flag-5'>评审</b>协作平台

    NVMe协议分析之提交队列

    NVMe指令提交与完成机制是NVMe协议的核心,该机制制定了NVMe指令的交互流程和处理步骤。
    的头像 发表于 05-15 23:25 761次阅读
    NVMe协议分析之<b class='flag-5'>提交</b>队列

    一文掌握Jenkins自动化部署

    烦恼;测试人员能在每次提交代码后立即看到测试结果,确保软件质量;运营团队不再需要熬夜加班来手动发布新版本,而是可以安心地看到系统自动完成一切。
    的头像 发表于 04-23 10:50 3001次阅读
    一文掌握Jenkins自动化部署