0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌研究人员发现了机器学习模型常见失败的一个主要原因

ss 来源:OFweek物联网 作者:OFweek物联网 2020-11-30 17:44 次阅读

机器学习模型在实验室中调整和调整到近乎完美的性能,但在现实环境中往往会失败,这已经不是什么秘密了。这通常被归结为人工智能接受训练和测试的数据与它在现实中遇到的数据不匹配,这个问题被称为数据转移。例如,经过训练,能够在高质量的医学图像中发现疾病迹象的人工智能,将难以识别繁忙的诊所中廉价相机捕捉到的模糊或裁剪的图像。

现在,谷歌的7个不同团队的40名研究人员发现了机器学习模型常见失败的另一个主要原因。这被称为“不规范”,它可能是一个比数据转移更大的问题。领导这项研究的Alex D‘amour说:“我们对机器学习模型的要求比我们目前的方法所能保证的要多。”

D’amour最初的调查如同滚雪球般滚来滚去,数十名谷歌研究人员最终着眼于一系列不同的人工智能应用,从图像识别到自然语言处理(NLP)再到疾病预测。他们发现,不规范的要求是所有这些项目表现不佳的原因。问题在于机器学习模型的训练和测试方式,没有简单的解决办法。

粗略地说,建立一个机器学习模型需要在大量的例子上训练它,然后在一堆它还没有见过的类似的例子上测试它。当模型通过测试时,就完成了。

谷歌的研究人员指出,这个标准太低了。训练过程可以产生许多不同的全部通过测试的模型,但是这些模型会有一些小差异,取决于诸如在培训开始之前随机值的神经网络中的节点、训练数据、被选中或者代表的方式、培训运行的数量等等。如果这些微小的、随机的差异不影响模型在测试中的表现,它们通常会被忽视。但事实证明,在现实世界中,它们会导致巨大的表现差异。

换句话说,如今用来构建大多数机器学习模型的过程无法区分哪些模型在现实世界中可行,哪些模型不可行。

为了解决这一问题,一种选择是在培训和测试过程中设计一个额外的阶段,在这个阶段中可以同时生产多个模型,而不是只生产一个。然后,这些相互竞争的模型可以在具体的现实任务中再次进行测试,以选择最适合这项工作的模型。

那需要做很多工作。苏黎世联邦理工学院的机器学习研究员Yannic Kilcher说,但是对于像谷歌这样建造和部署大型模型的公司来说,这样做是值得的。谷歌可以提供50种不同版本的NLP模型,应用程序开发人员可以选择最适合他们的一个,他说。

D ‘Amour和他的同事们还没有解决这个问题,但正在探索改进培训过程的方法。他表示:“我们需要更好地明确我们对模型的要求。”“因为最终的结果往往是,我们只是在模型在实际应用中失败之后才发现这些要求。”

如果人工智能想要在实验室之外产生和在实验室内部一样大的影响,那么进行修复是至关重要的。在谷歌从事医疗人工智能领域工作的合著者凯瑟琳海勒(Katherine Heller)表示,当人工智能在现实世界中表现不佳时,人们就不太愿意使用它了:“在杀手级应用方面,我们已经失去了很多信任,这是我们希望重新获得的重要信任。”

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5838

    浏览量

    103228
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263957
  • 机器学习
    +关注

    关注

    66

    文章

    8095

    浏览量

    130519
  • nlp
    nlp
    +关注

    关注

    1

    文章

    463

    浏览量

    21812
收藏 人收藏

    评论

    相关推荐

    谐波引起电缆损坏的主要原因

    谐波是指在电力系统中出现的频率为整数倍于基波频率的波动现象。在电缆中传输的电能中,谐波存在的情况是很常见的。然而,谐波也是导致电缆损坏的主要原因之一。
    的头像 发表于 03-14 14:20 136次阅读
    谐波引起电缆损坏的<b class='flag-5'>主要原因</b>

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的
    的头像 发表于 03-01 16:25 220次阅读

    谷歌模型框架是什么?有哪些功能和应用?

    谷歌模型框架(Google Model Framework)并不是一个特定的框架,而是指谷歌开发的一系列软件框架,用于支持机器学习和人工智能
    的头像 发表于 02-29 18:11 634次阅读

    谷歌发布轻量级开源人工智能模型Gemma

    谷歌近日宣布推出开源人工智能(AI)模型系列Gemma,旨在为开发人员研究人员提供一个负责任的AI构建平台。这一举措标志着自2022年OpenAI的ChatGPT引领AI聊天
    的头像 发表于 02-23 11:38 398次阅读

    谷歌宣布Gemma大模型全球开放使用

    使用标志着谷歌在AI领域的新里程碑,为全球的开发者、研究人员和企业提供了强大的工具,以推动人工智能技术的进步和应用。
    的头像 发表于 02-23 10:41 339次阅读

    辊压机轴承位磨损主要原因

    电子发烧友网站提供《辊压机轴承位磨损主要原因.docx》资料免费下载
    发表于 01-10 14:10 0次下载

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    训练是MetaAI研究人员认为的种降低模型使用成本的方式。为了更好的效果,即便是LLaMA最小的70亿参数的版本,其训练使用的tokens数量也有1万亿(1 trillion to
    发表于 12-22 10:18

    LabVIEW进行癌症预测模型研究

    效果。 LabVIEW在此研究中的应用展示其在处理复杂医学数据和开发高效预测模型方面的独特优势,特别是在癌症早期诊断和治疗策略的研究中。通过使用LabVIEW,
    发表于 12-13 19:04

    7种光缆故障的主要原因

    7种光缆故障的主要原因  光缆故障是指光缆在传输信息过程中出现的问题,影响着光信号的传输质量和速度。这些故障可能由多种原因引起,下面将详细介绍7种光缆故障的主要原因。 1. 光缆折断 光缆折断是最
    的头像 发表于 12-07 09:40 1079次阅读

    为什么共模电流是EMI的主要原因

    为什么共模电流是EMI的主要原因
    的头像 发表于 12-05 15:56 194次阅读
    为什么共模电流是EMI的<b class='flag-5'>主要原因</b>

    谷歌研究人员利用现有的耳机来测量心率

    谷歌研究人员发现,当音乐播放时,超声波方法效果很好,但它在嘈杂的环境中还可能存在问题,“APG信号有时会非常嘈杂,或可受到身体运动的严重干扰。”然而,他们发现,他们可以通过使用多个
    的头像 发表于 11-09 16:32 334次阅读

    研究人员发现了迄今为止最快的半导体

    科学家们发现了他们所说的迄今为止最快、最高效的半导体。尽管这种新材料是用地球上最稀有的元素之一制成,但研究人员表示,有可能会发现由更丰富的材料制成的替代物,其运行速度相当快。
    的头像 发表于 11-08 16:28 343次阅读

    请问单片机串口失败主要原因是什么?

    单片机串口通信,初始化按照书上写得,但是仍然通信失败,不知道是什么原因。想知道般大家遇到的通信通信失败原因有哪些?
    发表于 11-07 06:53

    谷歌发布人工智能学习模型机器人转换器使其机器人更智能

    据悉,谷歌希望通过发布人工智能学习模型机器人转换器(Robotic Transformer,RT-2)使其机器人更智能。 RT-2是该公司所
    的头像 发表于 08-01 17:19 776次阅读

    斩波电路电流能够连续的主要原因是什么?

    斩波电路电流能够连续的主要原因是什么?
    发表于 05-11 17:08