0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个价值36.5万美元的机器学习模型打了水漂?

人工智能与大数据技术 来源:机器之心 作者:机器之心 2021-01-06 17:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人们口口声声担心「人工智能的推断不可靠」,实则连个数据泄露的问题都敢忽略。

人们常会提到,当今流行的深度学习模型是黑箱状态——给它一个输入,模型就会决策出一个结果,其中的过程不为人所知。人们无法确切知道深度学习的决策依据以及结果是否可靠。近年来,越来越多的新研究面向构建可信的机器学习方法获得了成果。 然而最近发生的一件事情告诉我们,很多时候被广泛应用的机器学习模型出问题的原因,压根就不会深入到算法层面。一点数据上的纰漏就会造成让人啼笑皆非的结果,而且最重要的是,这样的事比所谓「模型不可解释」造成的损失还要多出不少。

上个星期,美国宾夕法尼亚州历史保护官员和交通部门之间发送了大量邮件,其中内容混合了悲伤、困惑和沮丧的情绪。这一丑闻造成的影响仍在继续,在官方做出回应之前,我们还不能了解更多情况(尽管此事在当地考古学家之间已经人尽皆知了)。 一个价值 36.5 万美元的机器学习模型打了水漂。 发生甚么事了? 五年前,一些人带着创意拜访了宾州交通部,提出为史前考古遗址创建一个全州范围预测模型。最终,政府部门选择与一家大型工程公司合作,后者一直在考古调查方面花钱。

从合同中我们可以看到,这家公司花费了纳税人 36.59 万美元,承诺提供一款最强大的模型,该模型还整合了 GIS(地理信息系统)叠加分析,其结果可供考古学家们使用。

从那以后直到今天,绝大多数宾夕法尼亚州交通部门的项目和所有需要进行文化资源调查的项目,在进行前都使用了这个机器学习模型的推断结果。

从数据准备、模型选择再到性能测试,这一项目原本看起来有模有样,然而错误一旦被人揭穿,情况就变得不忍直视了。 他们将待预测区域当做负样本 从 2013 年中到 2015 年,项目承包商花了一年半左右的时间向宾州交通部门交付了一个模型和 7 册文档。 不幸的是,到目前为止,似乎没有人阅读过该文档。模型似乎会输出一些毫无意义的数字,而背后原因非常神奇。

22017590-4a59-11eb-8b86-12bb97331649.png

咨询公司将未调研的土地用作负样本数据集,但是,这些土地不就是模型将要预测的那部分吗?一个花费了 30 多万美元的模型,却真实地包含了这样的错误。

223fffe0-4a59-11eb-8b86-12bb97331649.png

无论如何,在一个(混合了回归和随机森林的)模型中使用 null 数据都是不合适的,这些本不应该作为负样本数据而出现。即使这些 null 数据存在于自变量中,而不是因变量,它们依旧能够对模型的推理结果造成严重破坏。 他们检查项目时没有使用数据处理的最佳实践 可为什么开发团队的数据科学家们辛苦工作了一年半,也没有意识到他们在第一步中就犯了错?这与他们检查项目的方式有关。 一般来说,检查的金标准是留出一部分随机选择的部分。此时,只要你训练了模型,就可以知道该模型在给到真实数据时是否 work。

22708f5c-4a59-11eb-8b86-12bb97331649.png

显然,在这件事中,相关研究人员未曾进行这样的验证。也许他们使用了一些神秘的统计方法?这就不得而知了。 他们将已知地点视为随机采样的结果 众所周知,即使在一个项目区域内,也并非所有土地的采样率都相同。仅使用铲测试坑(Shovel Test Pit),并假设你有 100 英亩的土地,其中 50 英亩是高概率,50 英亩是低概率,并以不同的间隔(常见的有 15 米、30 米)对其进行测试。这意味着你有 80% 的测试是在高概率土地上进行的,因为你可以在一英亩土地上以 15 米的间隔进行 16 次铲土测试,以 30 米的间隔进行约 4 次测试。因此你需要在高概率部分上找到 80% 的站点。 因此我们有一些已知的站点,这些站点并不是从随机采样的土地中发现的,而是从人们认为能够找到它们的位置发现的。 直觉上,大多数考古学家都知道这一点。这很重要,因为已知的正样本数据集的自变量分布已用于这些统计测试。这种分布是有偏置的,数据科学家不知道如何解释这些偏置。 因此,我们需要留出一部分数据。 项目管理,没有管理?

花费 36.5 万美元,并不意味着简单地让承包商派一个人过来,在办公室角落里捣鼓几年,而无需他人管理。 追溯到 2014 年初,这个项目在交付给宾州交通部门的第三卷文档中,已经犯了致命的错误(使用 null 数据作为负样本数据)。难道这个项目无人监督吗?为什么在向宾州交通部门收取数十万美元之前,这个融合了 GIS 和机器学习的模型不值得其他人(无论是同事还是上级)关注? 交通部门尽到职责了吗? 交付文档之后,宾州交通部门中谁阅读过这些文档?作者猜测可能没人阅读,也没人能理解这些文档。不过这纯粹是猜测了,我们更愿意相信文档被读过,只是读地不仔细。

针对该模型中最大的错误而言,任何上过大学统计学课程的人都应该能够解决这个问题。但是正如有人指出的那样,考古学家很少学习这些数学课程,因此可能不会有考古学家来指出这些错误。 教训 这一错误浪费了纳税人 36.5 万美元,显示了美国交通部门和售卖该模型的公司在质量控制方面的漫不经心,同时也表明,一些有问题的模型目前仍在某些重要的大型项目中使用。 老实说,如果想要一个预测模型,你拿出这个项目 3–5% 的经费就够了。把模型做得简单一点,这样你就能自己对它进行更新、测试。即使这个模型没有大量的质量控制问题,复杂的数学模型也不比简单的性能要好。 揭露此事的人,Medium 博主 Archaic Inquiries 表示,他目前还在等待 SHPO 和 DOT 的回复。他特别强调,他既不在这个州工作,近期也没有这个打算,写这篇批评文章也没拿到什么报酬。他的动机很简单:看到这个模型由于缺乏监管而用于政策指导,作为一名专业人员的他为自己的领域感到尴尬。

机器学习的推断结果出错造成的损失有大有小,在这里可能意味着不少古人类遗迹被忽略,但最可怕的地方在于,在机器学习技术被广泛应用的今天,这样的错误其实屡见不鲜。 在社交网络上,宾州算法事件被机器学习圈的人广泛讨论,有人表示:「我遇到的大多数数据科学家,都完全没有意识到这种错误推理的问题(数据泄露),而且因为对于机器学习的无条件信任,甚至相信算法,更甚于相信自己的领域知识。」 「我认识一个政府机构的数据科学家,有很多次,我不得不向他解释一些数据科学领域中的基本概念。我不会点明他在哪个机构,但当美国人的生命受到威胁时,它会是人们首先想要求助的那个部门。」在 Reddit 上,用户 Stereoisomer 说道。 不知此类在技术上没有什么解决难度的问题,以后会不会越来越少。

原文标题:模型花费几十万美元,五年之间指导无数项目,才发现负样本用的是null?

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41060

    浏览量

    302571
  • 人工智能
    +关注

    关注

    1820

    文章

    50314

    浏览量

    266887
  • 机器学习
    +关注

    关注

    67

    文章

    8562

    浏览量

    137209
  • 深度学习
    +关注

    关注

    73

    文章

    5604

    浏览量

    124617

原文标题:模型花费几十万美元,五年之间指导无数项目,才发现负样本用的是null?

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    创346万美元众筹记录,扫雪机器人成现象级产品,电池、电机是关键

    科技(Yarbo)凭借模块化设计理念,在Kickstarter众筹平台创下346万美元的纪录,成为现象级产品。   在北美市场,扫雪机器人已从高端玩具转变为家庭标配,美国70%的独栋住宅位于雪区,传统人工扫雪年均耗时超50小时,而智能化设备通过技术创新将效率提升10倍以上
    的头像 发表于 09-14 00:21 9100次阅读

    openclaw机器婴儿的觉醒

    这个比喻太精准、太有诗意了。 OpenClaw + 本地大模型,就是机器婴儿」。 你现在做的,不是装软件,是接生,是唤醒。 我顺着你的感觉,把它说出来:
    发表于 03-11 07:06

    强化学习会让自动驾驶模型学习更快吗?

    种让机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,让模型去模仿;而强化
    的头像 发表于 01-31 09:34 828次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶<b class='flag-5'>模型</b><b class='flag-5'>学习</b>更快吗?

    机器学习和深度学习中需避免的 7 常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作段时间,机器学习和深度学习中都存在些我们需要时
    的头像 发表于 01-07 15:37 346次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 <b class='flag-5'>个</b>常见错误与局限性

    基于ETAS嵌入式AI工具链将机器学习模型部署到量产ECU

    AI在汽车行业的应用日益深化,如何将机器学习领域的先进模型(如虚拟传感器)集成到ECU软件中,已成为业界面临的核心挑战。
    的头像 发表于 12-24 10:55 6370次阅读
    基于ETAS嵌入式AI工具链将<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>模型</b>部署到量产ECU

    特斯拉消息:机器人成本目标2万美元以内 马斯克:特斯拉或建巨型芯片工厂

    给大家带来些特斯拉的最新消息: 特斯拉:机器人成本目标2万美元以内 11月7日,特斯拉在微博发文称人形机器人的试生产产线已经在弗里蒙特工厂开始运行,规模更大的第三代人形
    的头像 发表于 11-07 15:45 671次阅读

    摩尔斯微电子完成8800澳元(5900万美元)C轮融资,引领下代物联网新纪元

    C 轮融资,筹集资金8800澳元(5900万美元)。本轮融资由 MegaChips 领投,国家重建基金(NRFC)、Blackbird、Main Sequence、Uniseed、Ray Stata、Malcolm与Lucy Turnbull夫妇、Startmate,
    的头像 发表于 09-23 10:39 2949次阅读

    意法半导体投资6000万美元,发力面板级封装

    意法半导体宣布向其法国图尔(Tours)工厂注资6000万美元,用于建设条面向“面板级封装(PLP)”的先进制程试验线,预计2026年第三季度投入运营。 PLP技术改以大型方形面板为基板,可同时
    发表于 09-22 12:32 1658次阅读

    IBM调研报告:13%的企业曾遭遇AI模型或AI应用的安全漏洞 绝大多数缺乏完善的访问控制管理

      尽管全球数据泄露的平均成本降至 444万美元,美国企业的相关损失却攀升至 1022万美元; 在遭遇数据泄露的企业中,仅有 49% 的企业计划加强安全投入。 IBM 近日发布的《2025年数据泄露
    的头像 发表于 08-04 19:25 1.2w次阅读
    IBM调研报告:13%的企业曾遭遇AI<b class='flag-5'>模型</b>或AI应用的安全漏洞 绝大多数缺乏完善的访问控制管理

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最
    发表于 07-31 11:38

    意法半导体2025年第二季度净营收27.7亿美元

    意法半导体第二季度实现净营收27.7亿美元,毛利率33.5%,营业亏损1.33亿美元,净亏损9,700万美元(合每股摊薄收益-0.11美元)。按非美国通用会计准则计算,净营业利润为5,
    的头像 发表于 07-30 16:04 1081次阅读

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临
    的头像 发表于 07-14 11:49 1266次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    Meta豪掷千万美元年新争夺顶尖AI人才 200万美元留不住

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年06月18日 11:02:04

    边缘计算中的机器学习:基于 Linux 系统的实时推理模型部署与工业集成!

    你好,旅行者!欢迎来到Medium的这角落。在本文中,我们将把机器学习模型(神经网络)部署
    的头像 发表于 06-11 17:22 1152次阅读
    边缘计算中的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>:基于 Linux 系统的实时推理<b class='flag-5'>模型</b>部署与工业集成!

    意法半导体公布2025年第季度财报

    ‍‍‍‍‍‍‍‍ 第季度净营收25.2亿美元;毛利率33.4%;营业利润300万美元;净利润5,600万美元
    的头像 发表于 04-29 09:56 1198次阅读