0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌研究人员发现了机器学习模型常见失败的一个主要原因

ss 来源:OFweek物联网 作者:OFweek物联网 2020-11-30 17:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习模型在实验室中调整和调整到近乎完美的性能,但在现实环境中往往会失败,这已经不是什么秘密了。这通常被归结为人工智能接受训练和测试的数据与它在现实中遇到的数据不匹配,这个问题被称为数据转移。例如,经过训练,能够在高质量的医学图像中发现疾病迹象的人工智能,将难以识别繁忙的诊所中廉价相机捕捉到的模糊或裁剪的图像。

现在,谷歌的7个不同团队的40名研究人员发现了机器学习模型常见失败的另一个主要原因。这被称为“不规范”,它可能是一个比数据转移更大的问题。领导这项研究的Alex D‘amour说:“我们对机器学习模型的要求比我们目前的方法所能保证的要多。”

D’amour最初的调查如同滚雪球般滚来滚去,数十名谷歌研究人员最终着眼于一系列不同的人工智能应用,从图像识别到自然语言处理(NLP)再到疾病预测。他们发现,不规范的要求是所有这些项目表现不佳的原因。问题在于机器学习模型的训练和测试方式,没有简单的解决办法。

粗略地说,建立一个机器学习模型需要在大量的例子上训练它,然后在一堆它还没有见过的类似的例子上测试它。当模型通过测试时,就完成了。

谷歌的研究人员指出,这个标准太低了。训练过程可以产生许多不同的全部通过测试的模型,但是这些模型会有一些小差异,取决于诸如在培训开始之前随机值的神经网络中的节点、训练数据、被选中或者代表的方式、培训运行的数量等等。如果这些微小的、随机的差异不影响模型在测试中的表现,它们通常会被忽视。但事实证明,在现实世界中,它们会导致巨大的表现差异。

换句话说,如今用来构建大多数机器学习模型的过程无法区分哪些模型在现实世界中可行,哪些模型不可行。

为了解决这一问题,一种选择是在培训和测试过程中设计一个额外的阶段,在这个阶段中可以同时生产多个模型,而不是只生产一个。然后,这些相互竞争的模型可以在具体的现实任务中再次进行测试,以选择最适合这项工作的模型。

那需要做很多工作。苏黎世联邦理工学院的机器学习研究员Yannic Kilcher说,但是对于像谷歌这样建造和部署大型模型的公司来说,这样做是值得的。谷歌可以提供50种不同版本的NLP模型,应用程序开发人员可以选择最适合他们的一个,他说。

D ‘Amour和他的同事们还没有解决这个问题,但正在探索改进培训过程的方法。他表示:“我们需要更好地明确我们对模型的要求。”“因为最终的结果往往是,我们只是在模型在实际应用中失败之后才发现这些要求。”

如果人工智能想要在实验室之外产生和在实验室内部一样大的影响,那么进行修复是至关重要的。在谷歌从事医疗人工智能领域工作的合著者凯瑟琳海勒(Katherine Heller)表示,当人工智能在现实世界中表现不佳时,人们就不太愿意使用它了:“在杀手级应用方面,我们已经失去了很多信任,这是我们希望重新获得的重要信任。”

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6259

    浏览量

    111965
  • AI
    AI
    +关注

    关注

    91

    文章

    41097

    浏览量

    302576
  • 机器学习
    +关注

    关注

    67

    文章

    8564

    浏览量

    137213
  • nlp
    nlp
    +关注

    关注

    1

    文章

    491

    浏览量

    23343
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    解读大型语言模型的偏见

    项新的研究中,研究人员发现了LLM中某种偏见的根本原因,为更准确、更可靠的AI系统铺平了道路。研究
    的头像 发表于 04-15 14:44 678次阅读
    解读大型语言<b class='flag-5'>模型</b>的偏见

    MOS 管烧坏、炸管的主要原因有哪些?怎么快速排查和解决?

    MOS管烧坏/炸管的主要原因有哪些?怎么快速排查和解决?相信不少工程师都经历过这样的“高光时刻”:上电瞬间,声脆响,缕青烟,MOS管直接报废。更让人头疼的是,有时候换上新管子,
    的头像 发表于 03-23 13:59 515次阅读
    MOS 管烧坏、炸管的<b class='flag-5'>主要原因</b>有哪些?怎么快速排查和解决?

    机器视觉镜头如何发现深海沉船

    的命运直是谜......直到杰里-埃利亚松和他的沉船猎人团队终于在水面下 535 英尺处发现了这艘船,它大体上完好无损地躺在湖床上。但找到它只是挑战的部分。记录它完全是另
    发表于 02-11 16:03

    谷歌正式发布Gemma Scope 2模型

    Scope 工具包推动了可解释性科学的发展,该工具旨在帮助研究人员理解我们轻量级开放模型系列 Gemma 2 的内部运作机制。
    的头像 发表于 01-24 14:01 731次阅读

    机器学习和深度学习中需避免的 7 常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作段时间,机器学习和深度学习中都存在些我们需要时
    的头像 发表于 01-07 15:37 348次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 <b class='flag-5'>个</b><b class='flag-5'>常见</b>错误与局限性

    轴承锈蚀的主要原因分析

    轴承锈蚀的主要原因分析 环境因素 湿度:空气中湿度的大小对轴承的锈蚀速度有很大的影响。在临界湿度下,金属锈蚀的速度很慢,旦湿度超过临界湿度,金属锈蚀的速度会突然上升。钢铁的临界湿度在65%左右
    的头像 发表于 11-22 10:50 2163次阅读

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保护科学

    从中获得有意义的信息。而这正是深度学习改变游戏规则的地方。 深度学习模型和人工智能加速硬件释放了PAM真正的可扩展潜力,使科学家能够在合理的时间内分析数TB的记录。迁移学习意味着
    发表于 10-27 09:18

    文读懂大模型常见的10核心概念

    如今高效智能的AI大模型,正如雨后春笋般破土而出,人们对于AI大模型学习与探索之路,也愈发宽阔平坦。虽然AI工具已不再陌生,但其中关于AIPrompt、大模型的吞吐量、蒸馏与量化、私
    的头像 发表于 09-22 17:02 1378次阅读
    <b class='flag-5'>一</b>文读懂大<b class='flag-5'>模型</b><b class='flag-5'>常见</b>的10<b class='flag-5'>个</b>核心概念

    电流探头消磁失败原因与解决策略

    探头的消磁失败现象时有发生,这不仅会降低测量结果的准确性,还可能影响测试进度。本文深入剖析消磁失败常见原因,并提出了针对性的解决策略。
    的头像 发表于 09-18 13:46 712次阅读
    电流探头消磁<b class='flag-5'>失败</b>的<b class='flag-5'>原因</b>与解决策略

    3Dfindit 提供的数字立方体模型研究项目的可视化提供支持

    作为学习项目的部分,罗伊特林根教育大学的学生们在比辛根集中营纪念地的博物馆中使用 3Dfindit 动画立方体模型进行了学习。作为历史教学研讨会的
    发表于 08-01 14:36

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最
    发表于 07-31 11:38

    ai_cube训练模型最后部署失败是什么原因

    ai_cube训练模型最后部署失败是什么原因?文件保存路径里也没有中文 查看AICube/AI_Cube.log,看看报什么错?
    发表于 07-30 08:15

    无刷直流电机双闭环串级控制系统仿真研究

    Madlab进行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人员提出采用节点电流法对电机控制系统进行分析,通过列写m函数,建立BLDC控制系统真模型,这种方法实质上是种整体建模
    发表于 07-07 18:36

    sys_sem_free()传入的参数变成了NULL,引起这个现象的主要原因有哪些?

    ).sem); 此时该传入的参数在莫名的情况下变成了NULL,该问题发生在频繁建立和断开TCP连接的测试案例中。 请教下引起这个现象的主要原因有哪些?
    发表于 04-30 07:35

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 1193次阅读