0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习的最新研究成果很少转化成商业产品,是真的吗?

jmiy_worldofai 来源:lq 2019-01-22 10:05 次阅读

我们都知道最新的科研成果和实际商业应用中使用的技术会有一定的距离。一面是高复杂度、特定(较简单一致)的输入和直接量化的性能指标,另一面是资源成本的限制、为各种各样情况考虑预案,以及评价标准要变成更高阶、更综合性的用户满意度、营收等等。

所以实际上,即便整个计算机科学界、互联网商业中大家一直对AI抱有热情,我们能看到的使用了机器学习的商业化产品也并不多,高度集中在图像处理、文本翻译和语音识别几类任务中,具体使用的算法也往往并不是学术界内认为先进的算法。

有网友观察到了这样的现象,在 Hacker News的问答板块提问道:「学术界一直在不停地做出新的科研进展,但是工业界好像并没有选择使用这些新鲜成果,包括胶囊网络或者自动网络搜索方面的成果。所以说前沿的科学技术研究和技术商业化之间就是注定有深深的鸿沟吗?这些新研究出的模型都没有什么可能快速商业化、变成产品吗?」

曾在斯坦福大学与 UC伯克利大学学习计算机科学、在谷歌大脑团队实习,如今身为全栈开发工程师DennyBritz给出了一些自己的想法:

大多数科研成果带来的提升比较有限,而新的技术要有能力带来足够大的提升才会被产业界吸收。99.9%的科研论文提出的技术都是带来优化指标(评价指标,比如准确率、ROCAUC、BLEU分数等等)的小幅提升。然而表现提升的同时一般都伴随着计算复杂度的提升、更高的训练成本、更低的模型稳定性、代码可维护性的挑战等等。对于谷歌广告词搜索、谷歌翻译之外的绝大多数企业的业务来说,只为了把某项优化指标的数字提升一点点就增加许多成本是根本划不来的。使用一个现成的、经过时间考验的简单、成熟、稳定的模型要好得多,训练很快、维护简单。即便它们的跑分会低 1%。

学术研究一般都关心的是如何改进模型,那么在研究中就不可以改变训练/测试数据。对于科研来说这是理所当然的,毕竟在同样的数据上跑出来的结果才有可比性。但是在真实世界中,你可以自由地收集更多的训练数据、清理数据、选择更有针对性的验证和测试数据,等等。在大多数情况下,有更准确的、更多的数据、更干净的数据,都要比换一个更强的模型效果更好。而且处理数据的事情也更好做,更有迹可循。所以对于产业界来说,他们把精力花在数据上通常更合适。

科研论文里使用的优化指标没有什么能直接迁移到真实世界的商业指标中的,而且同时有很多科研中的想法会过拟合到这些指标和/或数据集上。比如,研究机器翻译的论文都会优化一个叫做「BLEU 分数」的指标,但是真实的翻译应用中需要考虑的用户满意度和「用户评分分数」。这可就是学术科研很难优化的了。类似地,商业产品并不能直接把「ImageNet 图像分类准确率」拿出来卖,不仅模型在应用场景中面对的图像会与 ImageNet 数据集不同,用户满意度也并不直接对等于识别准确率。科研论文会关心特定数据集上的特定指标(因为论文就是这样评审的),但是一个模型在这个数据集上的这个指标表现好,不一定它在别的数据集、别的指标也有好的表现(即便数据集和指标可能是类似的)。实际上,即便是含有已知的错误的数据集也会在科研研究中一直用下去,因为不同的技术以前就是在这些数据集上比较的(雷锋网 AI 科技评论有篇旧文解析过ImageNet中错误分类的图像)。而商业应用里就不会发生这样的事情。

对于这个问题,你认同提问者的观察吗?你对这样的现象有别的见解吗?欢迎留言与我们讨论。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    10906

    浏览量

    100728
  • 计算机科学
    +关注

    关注

    1

    文章

    140

    浏览量

    11232
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130556

原文标题:机器学习的最新研究成果很少转化成商业产品,是真的吗?

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗?

    请问,ADUCM350可以同时处理生物阻抗信号、声音转化成的电流信号吗? ADUCM350可以处理惯性传感器收集的运动信号吗? 同时收集和处理生物阻抗、声音、运动信号,除了评估套装(EVAL-ADUCM350EBZ)以外,还需要购买其他配套的评估板吗?
    发表于 01-11 07:10

    怎么用verdi将fsdb格式的波形转化成txt呢?

    和大家分享一个小技巧,你在debug问题的时候,是不是也曾经想过将波形中的某些信号转化成txt,然后用txt的值复现某些波形或者与理论值对比。
    的头像 发表于 01-10 09:19 898次阅读
    怎么用verdi将fsdb格式的波形<b class='flag-5'>转化成</b>txt呢?

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    市举办。 在NeurIPS 2023上,英特尔研究院将展示其最新AI研究成果,并和产业界、学术界分享英特尔“让AI无处不在”的愿景。大会期间,英特尔研究院将发表31篇论文,包括12篇主会场论文和19篇研讨会论文,并在405号展台
    的头像 发表于 12-08 19:15 350次阅读

    英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

    英特尔研究院将重点展示31项研究成果,它们将推进面向未来的AI创新。        英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的AI创新成果。面向广大开
    的头像 发表于 12-08 09:17 401次阅读

    百度蛋白大语言模型研究成果登上Nature子刊封面

    百度最新研究成果登上Nature子刊封面,文心生物计算大模型获国际顶刊认可!
    的头像 发表于 11-25 11:25 662次阅读
    百度蛋白大语言模型<b class='flag-5'>研究成果</b>登上Nature子刊封面

    oracle将clob转化成string

    将CLOB(Character Large Object)转换为字符串是一种常见的需求,特别是在处理大文本数据时。Oracle数据库提供了几种方法和函数来实现这个转换过程。本文将详细介绍这些方法和函数,并提供示例代码和使用提示。 一、使用DBMS_LOB包 DBMS_LOB是Oracle提供的一个内置包,提供了许多操作LOB类型(包括CLOB)的函数。 使用DBMS_LOB.GETLENGTH函数获取CLOB的长度: DECLARE v_clob CLOB; v_length NUMBER; BEGIN v_clob := 'This is a sample CLOB.'; v_length := DBMS_LOB.GETLENGTH(v_clob); DBMS_OUTPUT.PUT_LINE(
    的头像 发表于 11-21 11:24 4663次阅读

    51单片机如何将程序转化成硬件变化​?

    51单片机如何将程序转化成硬件变化
    发表于 11-01 08:19

    “数字经济企业TOP500”研究成果发布 软通动力荣登评选

    10月26日,2023数字经济企业研究成果发布暨研讨会在京举办,中国企业评价协会与中国信息通信研究院公布“数字经济企业TOP500”。软通动力以优秀的数字技术服务实力及助力数字经济发展所做出的贡献
    的头像 发表于 10-29 15:55 198次阅读
    “数字经济企业TOP500”<b class='flag-5'>研究成果</b>发布 软通动力荣登评选

    sic功率半导体上市公司 sic功率半导体技术如何实现成果转化

    解更多公司,建议查询相关网站。 sic功率半导体技术如何实现成果转化 SIC功率半导体技术的成果转化可以通过以下途径实现: 与现有产业合作:寻找现有的使用SIC功率半导体技术的企业,与
    的头像 发表于 10-18 16:14 689次阅读

    两关节机械手的自适应控制介绍

    了进一步的发展和完善。近年来,国内外学者对自适应控制已做了卓越的研究工作,也取得了可喜的研究成果,有许多研究成果已经应用到生产实际中。 随着科学技术的发展和社会的进步,机器人的应用越来
    发表于 09-21 07:55

    解决医疗大模型训练数据难题,商汤最新研究成果登「Nature」子刊

    生成式AI正为医疗大模型迭代按下加速键。 近日,商汤科技联合行业合作伙伴,结合生成式人工智能和医疗图像数据的多中心联邦学习发表的最新研究成果 《通过分布式合成学习挖掘多中心异构医疗数据
    的头像 发表于 09-12 18:50 603次阅读
    解决医疗大模型训练数据难题,商汤最新<b class='flag-5'>研究成果</b>登「Nature」子刊

    机器学习研究现状和发展趋势 机器学习的常见算法和优缺点

    随着计算能力和大数据的崛起,机器学习算法正迎来快速发展的时期。在研究层面上,机器学习和深度学习
    发表于 08-22 17:49 1909次阅读

    机器学习发展历程

    机器学习发展历程:机器学习发展现状、机器学习发展前景和机器
    的头像 发表于 08-17 16:30 1208次阅读

    如何将220V交流电转化成12V直流电呢?有哪些方法?

    直流12V应用于很多场合,那么如何将220V交流电转化成12V直流电,其实有很多种方法,可以用反激式、正激式、AD-DC、阻容降压等方法实现,下面介绍几种方法。
    的头像 发表于 08-12 15:35 1.6w次阅读
    如何将220V交流电<b class='flag-5'>转化成</b>12V直流电呢?有哪些方法?

    捷易科技物联网平台荣获工信部科学技术研究成果登记,技术国内先进

    2023年7月5日,捷易科技自研的“基于开放性智能设备识别与配置的物联网终端管理云平台的开发应用”科学技术研究成果经评审、公示获准登记,荣获国家工业和信息化部颁发的科学技术成果登记证书。本次评定
    的头像 发表于 08-01 08:29 828次阅读
    捷易科技物联网平台荣获工信部科学技术<b class='flag-5'>研究成果</b>登记,技术国内先进