0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习两种类型的偏见

汽车玩家 来源:今日头条 作者:闻数起舞 2020-05-03 17:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

TL; DR-许多ML应用程序在理论上很有用,但在实践中却变得毫无用处。 让我们看一个真实的案例研究,重点介绍两种类型的偏见,以及如何理解"信任时刻"可以如何通过一个具体例子提供帮助。 最后,我要考虑三个小动作。

故事

我内心的声音:"她有外遇吗? 她一定是。 **我!" 当你美丽的妻子突然在离家那么多夜晚的时候,你不能怪我这么想。她从此不必工作太多。

因此,我问:"怎么回事? 你最近怎么这么忙 一切都好吗?"

杰西:"我不知道你们为什么再继续制作这些无用的AI东西! 他们不断使我们做更多的工作。" 好吧,我完全没有看到那件事。 还有哦 作为一个充满爱心的丈夫,正确的做法是给她一个拥抱并承担更多的家务劳动(是的,我做到了。)

更重要的是,为了满足我的自私好奇心,追求更好地完成自己的工作以及促进机器学习社区的进步,我需要倾听。

因此,我进行了调查:"告诉我更多。 发生了什么? 你为什么这么说?"

两种类型的偏见和不同的问题

杰西继续说:"我们有了这个新的Next Best Action应用程序[ML应用程序]。 每个星期,它会向我们提供要致电的客户列表和要提供的产品。 真是无用 我看清单。 我与大多数客户一起工作; 我知道他们不会购买该产品……这是浪费时间,但是我们仍然必须这样做才能使KPI看起来更好。"

Jess刚刚描述了每个ML应用程序都面临的两个独特问题。 让我们打开包装:

1.机器偏差。 机器错误; 我们人类是正确的。 机器学习模型不是也不是完美的,即使我们希望并认为它们是完美的。 人们在进行日常工作时会看到大量数据,随后将其内部化为直觉和知识。 但是此类数据可能无法在数据库中正确收集或表示。 结果,机器无法充分分析并做出更好的预测。

2.人的偏见。 机器是对的; 我们错了。 人类有过分自信的偏见。 换句话说,我们通常会高估预测的准确性,尤其是在我们的专业领域。 也许,机器实际上比我们了解更多和最新的信息。 因此可以产生更好的预测。 但是我们比机器更信任自己。

ML社区中的我们许多人可能会立即问:我们如何修复机器(例如模型)? 公司正在招聘更好的数据科学人才,实施更严格的ML Ops实践,并升级到更好的工具。 但是,这样做只能解决机器偏差问题。 一条链与最薄弱的链接一样牢固:ML应用程序的用户。

我们无法消除人为的内在偏见,但我们可以为信任而设计。 有了信任,用户就更愿意与机器进行协作。 那么,我们如何在用户和ML应用程序之间建立信任? -这是我们应该问的问题。

让我们来看一个具体的示例,并讨论如何使用"信任时刻"分析和简单的UX技术进行信任设计。

一步一步来

实际上,"无用的机器学习经验"是一个反复出现的主题。 我和杰西在不同的场合遇到了类似的问题。 正如我在《人工智能的最后一英里问题》中所述,归结为人与人工智能协作的脱节。 解决问题需要采用综合方法来解决三个方面的问题。

机器学习两种类型的偏见

> Author's Analysis, The Last Mile Problems of AI

如果我们不解决这个问题怎么办? 如果我们不解决信任问题,每个人都会感到沮丧。 像Jess这样的用户将不断抱怨" AI事物"是无用的,并且由于自偏而无法从惊人的技术中受益。 数据科学家可能会失去工作,因为模型的实际结果将永远与理想的估计不符; 企业将永远无法实现AI的承诺价值; 最重要的是,我将不得不继续听Jess,我在数据科学领域的朋友以及我的客户互相抱怨。

要构建有用的ML应用程序,我们需要采取许多步骤。 为信任而设计是伟大而简单的第一步。 现在就采取行动。

建议的动作:

· 在公司中识别面向用户的ML用例

· 将用户旅程和信任时刻分析整合到您的ML设计工作流程中

· 主持基于信任时刻的协作设计会议,与来自数据科学,工程和用户组(例如前线)的代表进行交流。

更深层次的问题与解决方案

信任的时刻#1:让我们看一下步骤4。这是用户看到预测,了解预测的含义并决定是否应该以及如何采取行动的那一刻。

问题:用户没有根据预测采取行动。 通常,用户会看到提供或要做的事情的简单描述(请参见左侧的插图)。 当用户需要决定是否要遵循时,他们会盲目相信或倾向于当前的判断。 考虑到我们的过度自信偏见,我们倾向于选择后者。

换句话说,许多预测(数据科学家们全心全意地做出的预测)从来没有真正"进入市场"。 它们只是在用户的屏幕上闪烁,然后消失。

这导致了另外两个问题。 首先,由于错误的原因,用户与机器的交互将在数据库中被捕获为"失败"。 机器认为由于数学错误,交互失败。 但实际上,它失败是因为用户没有采取行动或未正确执行。 其次,当机器学习时,他们会学习错误的现实。 这就是所谓的反馈回路问题(我们将在下面讨论)。 结果,它造成了产生不合情理的预测的恶性循环,并最终破坏了用户的信任。

这些不是预测问题。 他们是UX问题。

目标:此步骤的主要目标应该有两个:1)增加采取的行动的百分比,2)提高行动的质量。

解决方案:考虑到这一点,我建议用上下文提示代替上下文脱离的建议。 上下文提示应突出显示使用人类可读语言执行ML预测的"为什么","什么"和"如何"(左图)。 根据算法的类型,有多种方法可以将机器决策转换为人类可读的语言。

机器学习两种类型的偏见

机器学习两种类型的偏见

> Step 4 — Presenting Suggestions: The Problem (Left) and The Fix (Right); Author's analysis & expe

信任时刻#2:让我们看一下用户共享笔记的第7步。

问题:用户无法提供良好的反馈。 通常,此界面允许用户跟踪进度并与其他成员进行协调。 但是,它通常不是为了捕获ML应用程序的反馈而设计的(也没有激励用户这样做)。 如前所述,损坏的反馈回路或不良的反馈回路都会为ML模型从错误中学习造成问题。 就像人类一样,良好的反馈使我们能够更快更好地学习。

目标:在此步骤中,主要目标是鼓励用户为自己和机器分享更好的反馈。

解决方案:最简单的解决方案是使用大多数人熟悉的UI元素。 这些UI元素可以帮助标准化输入并缩短输入信息的时间。

机器学习两种类型的偏见

机器学习两种类型的偏见

> Step 7 — Collecting Feedback: The Problem (Left) and The Fix (Right); Author's analysis & experie

ML应用程序除了提供用于捕获反馈的UX外,还可以共享其如何使用反馈来改进未来的预测。 这可以给用户带来参与感和奖励。

注意:所有截图均已保密。 它们代表具有类似应用程序的组织中的常见元素。

信任时刻

注意:以下示例受Jess作为前线工作的启发,该工作需要亲自为客户提供服务。 尽管它只关注一个用例,但是这些原理适用于人类需要从ML应用程序中获取信息并决定如何采取行动的许多过程。

为了更清楚,更具体地了解问题,首先,我们应该看一下"信任时刻",即人们需要基于对机器的信任进行判断时的瞬间。 我们可以通过使用用户旅程分析来突出显示这些时刻。

想象一下,当您去一家银行的分行与一名顾问会面时,这是从顾问的角度来看的典型旅程-ML应用程序的用户:

机器学习两种类型的偏见

> Moments of Trust Analysis, Author's Experience

了解信任的时刻有助于我们找到用户可能无法接受机器学习系统的预测时的特定压力点。 让我们解开每个信任时刻揭示的问题。

结论

许多ML应用程序被用户认为是无用的,不是因为预测的准确性,而是因为人为偏见。 作为ML应用程序的设计者和开发者,我们有责任进行信任设计。

解决方案通常很简单。 通过确定信任时刻,我们可以设计有效的用户体验,以提供更多的上下文预测,并闭合反馈循环,从而实现持续改进。

实际上,我们,人类和机器都不完美。 为信任而设计不仅提供快速解决方案,还为人类和机器架起了一座桥梁,以校准我们的信任并共同提高。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136241
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    设备身份唯一标识和基于数字证书的身份认证两种方案,在应用场景上有何侧重,分别适用于哪些类型的物联网设备?

    设备身份唯一标识和基于数字证书的身份认证两种方案,在应用场景上有何侧重,分别适用于哪些类型的物联网设备?
    发表于 11-18 06:26

    单模光纤线有几种类型

    单模光纤线根据ITU-T国际标准(G.65x系列)主要分为以下六种类型,每种类型在传输性能、应用场景和成本上存在差异: G.652(常规单模光纤): 核心特性:零色散波长在1310nm附近
    的头像 发表于 09-11 10:00 1142次阅读

    工业相机的类型及不同类型的应用

    工业相机根据不同的分类标准,可分为多种类型,每种类型都有其独特的应用场景。
    的头像 发表于 08-29 17:07 572次阅读
    工业相机的<b class='flag-5'>类型</b>及不同<b class='flag-5'>类型</b>的应用

    机器人关节模组:类型、设计、工作原理及应用

    机器人关节模组是一种用于驱动机器人关节转动、轮子旋转或控制夹爪运动的装置。根据负载需求,机器人关节模组有多种类型。负载通常涉及扭矩、精度、操作速度、功耗等因素。
    的头像 发表于 08-29 14:22 2541次阅读
    <b class='flag-5'>机器</b>人关节模组:<b class='flag-5'>类型</b>、设计、工作原理及应用

    AI输出“偏见”,人类能否信任它的“三观”?

    人工智能(AI)已成为我们不可分割的“伙伴”。从聊天机器人、语音助手到自动翻译,AI不断介入人与人之间的交流和理解。然而,它能做到“客观中立”吗?据美国《麻省理工科技评论》官网报道,一项国际研究指出
    的头像 发表于 08-04 13:43 1191次阅读
    AI输出“<b class='flag-5'>偏见</b>”,人类能否信任它的“三观”?

    界首各种类型在线测径仪原理与分类

    旋转测径仪两种类型,可进行任意角度摆动测量或360°旋转测量。 应用:高速轧制线、棒、管材等的检测,常被应用于轧钢厂。 8、激光大直径测径仪 原理:台激光传感器,可实时采集测头到被测物外表面的距离
    发表于 07-31 15:36

    浪涌保护器从实物上如何判断是哪种类型?一学就会

    朋友们大家好,在采购浪涌保护器(SPD)或者学习相关知识的时候,如果你不是很了解产品,是不是常常苦恼怎么从外表上知道浪涌保护器是哪种类型呢?其实,掌握一些小技巧,就能轻松判断。接下来这篇文章,小编就为大家详细介绍从实物外观判断浪涌保护器
    的头像 发表于 07-22 18:26 1143次阅读
    浪涌保护器从实物上如何判断是哪<b class='flag-5'>种类型</b>?一学就会

    分布式存储有哪几种类型?

    分布式存储有哪几种类型?分布式存储系统是一种将数据分散存储在多台独立节点上的技术,根据数据模型可分为键值存储、列式存储、文档存储和图形存储等类型;按数据存储单位可分为基于文件、块和对象的存储;按
    的头像 发表于 02-20 11:00 1132次阅读

    快问快答:有哪两种设备分别产品的抗破坏能力和是否泄漏工作介质?

    在工业领域,为了确保设备在运行过程中的安全性和可靠性,必须进行严格的试压。试压分为两种类型:强度试验和密封性测试。这如同对设备进行一次全面的「体检」,既要检查「身体」是否强壮(抗破坏能力),又要检查
    的头像 发表于 02-06 11:39 528次阅读
    快问快答:有哪<b class='flag-5'>两种</b>设备分别产品的抗破坏能力和是否泄漏工作介质?

    ISO7241是属于哪种类型的隔离器件?是否是磁隔离?

    请问贵公司的ISO7241是属于哪种类型的隔离器件?是否是磁隔离?如果不是磁隔离,有没有属于磁隔离类型的芯片?需要3路输出,1路输入的,同ISO7241,谢谢!
    发表于 01-24 07:38

    电源管理IC的八种类型

    工程师必知:电源管理IC的八种类型 引 言 在日常生活中,人们对电子设备的依赖越来越严重,电子技术的更新换代,也同时意味着人们对电源的技术发展寄予厚望,下面就为大家介绍电源管理技术的主要分 类
    的头像 发表于 01-20 09:50 3901次阅读

    不同类型机器人及其所需的滑环种类

    机器人一直是导电滑环的一个重要的应用领域,由于所对应的行业或者应用场景不同,机器人也被分成很多类型,比较常见的分类是工业机器人、消费级机器
    的头像 发表于 01-10 12:24 848次阅读

    【「具身智能机器人系统」阅读体验】+本互为支持的书

    最近在阅读《具身智能机器人系统》这本书的同时,还读了 《计算机视觉之PyTorch数字图像处理》一书,这本书完全可以视为是互为依托的姊妹篇。《计算机视觉之PyTorch数字图像处理》是介绍
    发表于 01-01 15:50

    压敏电阻有哪些应用类型

    用压敏电阻。 一、保护用压敏电阻 电源保护用压敏电阻 主要用于保护电源线路免受瞬态过电压(如雷电过电压、操作过电压等)的损害。 可以根据施加在压敏电阻上的连续工作电压的不同,区分为交流用和直流用两种类型。 信号线、数据
    的头像 发表于 12-30 15:58 1040次阅读
    压敏电阻有哪些应用<b class='flag-5'>类型</b>?

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 705次阅读