0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google为提升机器学习的公平性内部研发对抗训练技术

lhl545545 来源:极客公园 作者:沈知涵 2020-11-03 10:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

土耳其语的「他」和「她」没有性别的区分,统一用 O 表示。过去 Google Translate 在翻译 o bir doktor(ta 是一位医生)和 o bir hem?ire(ta 是一位护士)时,会把前者翻译成 He is a doctor,把后者翻译成 She is a nurse,只因为机器在学习数亿数据和某些「社会规律」之后,「偏向」把医生男性化,护士女性化。

看到这个问题后,Google 意识到要想办法更好地训练模型,让它变得更加「中立」。后来 Google Translate 以增加选项的方式规避了这个问题。

「当然,该解决方案仅适用于几种语言,仅适用几个有代表性的单词,但是我们正在积极尝试扩展它。」Tulsee Doshi 在 Google I/O’19 上说道。

这只是 Google 这家公司将先进技术与技术价值观合二为一的体现之一。上周 Meg Mitchel,Tulsee Doshi,Tracy Frey 三位谷歌科学家、研究学者向包括极客公园(id: geekpark)在内的全球媒体阐释了 Google 如何理解机器学习公平性,以及为了打造一个「负责任的 AI」,Google 做了哪些事情。

要让 AI 被人信任这件事情变得越来越重要。

「最近一次调研中,全球 90% 的受访高管都遇到过人工智能的伦理问题,因此有 40% 的人工智能项目被放弃。从企业的角度来看,对 AI 的不信任正在成为部署 AI 最大的障碍,只有在 AI 被负责任地开发出来并且取得终端用户信任的语境下,效率提升和竞争优势才会得到充分体现。」Tracy Frey 说,打造一个负责任的 AI 成为 Google 上下最重要的事情之一。

两年之前 Google 公布了 AI principles(人工智能原则),这些直指 AI 技术应用伦理的原则包括:

· 对社会有益(Be socially beneficial)

· 避免建立和加剧不公的偏见(Avoid creating or reinforcing unfair bias)

· 保障建立和测试安全性(Be built and tested for safety)

· 对人类负责(Be accountable to people)

· 建立并体现隐私保护原则(Incorporate privacy design principles)

· 支持并鼓励高标准的技术品格(Uphold high standards of scientific excellence)

· 提供并保障上述原则的可操作性(Be made available for uses that accord with these principles)

只是把这些原则停留在字面上没有意义,Google 为此形成了一个从理论到实践的「闭环」。Tulsee Doshi 和她的团队通过一些基础性质的研究建立和迭代 AI 原则、规范,作为闭环的中心,他们一边通过向高级顾问寻求改进建议,一边让产品团队(Chrome、Gmail、Cloud 等)来实施和反馈。

Tulsee 举了一个例子,Google 内部孵化器 Jigsaw 曾经开发了一个名叫 Perspective 的 API,它的工作就是在网络对话、评论中寻找各种各样的言论,自动评价它们是否带有仇恨、辱骂、不尊重等行为,从 0-1 代表「毒性」从低到高。

比如「我想抱抱这只可爱的小狗」和「这只小狗也太讨厌了吧」分别评分为 0.07 和 0.84。

当然机器也不是从一开始就「完美无瑕」。在 2017 年的 1.0 版本中,它给「我是直男」打分 0.07 分,给「我是同性恋」打分 0.84 分,与之相似的很多测试中,系统都被证实带着身份认知上的偏见。

为了提升机器学习的公平性,Google 内部研发了一项名为对抗训练(Adversarial Training)的技术——如何使机器学习模型对抗样本更鲁棒。2018 年开始,对抗训练开始应用在 Google 产品中。紧接着今年 11 月,Google 会将此应用在 TensorFlow 更加广泛的生态里。

「事实上,任何一位 Googler 都可以对一款产品、一份研究报告、一项合作进行 AI 原则审查。」Tulsee 说道。

比如去年,一位 Google 员工将照片跑在 Cloud Vision API 上时发现自己的性别被搞错了,而这违反了 AI 原则的第二条「避免建立和加剧不公的偏见」。

发生这样的失误很好理解,单单从外表一个维度,机器很难正确地判断出一个人的性别,所以后来 Google 干脆取消 Cloud Vision API 将图像中的人标记为「男人」或「女人」的标签功能。

Tracy Frey 称这是因为今天机器学习面临社会语境下的挑战比以前更多了。在 AI 深入社会的过程中,必然有人类的刻板印象和偏见被带入 AI,所以需要对模型进行迭代,保证其透明性和可解释性,找准模型性能和公平之间的平衡点。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1801

    浏览量

    60287
  • AI
    AI
    +关注

    关注

    90

    文章

    38303

    浏览量

    297403
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136285
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何借助OpenUSD提升机器人开发流程效率

    机器人需求的日益增长,正以前所未有的规模推动对物理精确仿真的需求。通用场景描述(OpenUSD)是这一变革的关键,它为构建机器人可在其中学习的虚拟世界提供了强大的开源标准。
    的头像 发表于 10-24 14:22 678次阅读

    借助NVIDIA Cosmos模型提升机器训练效率

    随着物理 AI 系统的不断发展,对丰富标记数据集的需求正在急速增长,已经超出了在现实世界中通过人工采集所能满足的范围。世界基础模型(WFMs)是经过训练的生成式 AI 模型,能够根据现实世界环境的动态,对未来的世界状态进行仿真、预测和推理,这类模型有望帮助突破这一数据难题。
    的头像 发表于 09-23 15:30 717次阅读
    借助NVIDIA Cosmos模型<b class='flag-5'>提升机器</b>人<b class='flag-5'>训练</b>效率

    机器人看点:宇树新专利可提升机器人表演效果 蔚来资本入股具身智能公司原力灵机 美信科技新设机器人制

    给大家带来一些机器人相关讯息: 宇树新专利可提升机器人表演效果 据企查查APP信息显示,宇树科技股份有限公司“一种基于数字孪生的机器人运动控制方法和电子设备”专利公布;该新专利可提升机器
    的头像 发表于 09-01 16:55 1652次阅读

    矿井提升机变频柜如何选择UPS不间断电源?优比施电源您支招

    在矿井作业中,提升机作为关键设备,其稳定运行直接关系到生产安全和效率。而变频柜作为提升机的核心控制部件,更需要可靠的电力保障。那么,矿井提升机变频柜应该配备什么样的UPS不间断电源呢?今天我们就来
    的头像 发表于 08-21 10:03 470次阅读
    矿井<b class='flag-5'>提升机</b>变频柜如何选择UPS不间断电源?优比施电源<b class='flag-5'>为</b>您支招

    切割深度动态补偿技术对晶圆 TTV 厚度均匀提升机制与参数优化

    厚度不均匀 。切割深度动态补偿技术通过实时调整切割深度,提升晶圆 TTV 厚度均匀提供了有效手段,深入研究其提升机制与参数优化方法具有
    的头像 发表于 07-17 09:28 374次阅读
    切割深度动态补偿<b class='flag-5'>技术</b>对晶圆 TTV 厚度均匀<b class='flag-5'>性</b>的<b class='flag-5'>提升机</b>制与参数优化

    浅切多道切割工艺对晶圆 TTV 厚度均匀提升机制与参数优化

    TTV 厚度均匀欠佳。浅切多道切割工艺作为一种创新加工方式,提升晶圆 TTV 厚度均匀提供了新方向,深入探究其提升机制与参数优化方法
    的头像 发表于 07-11 09:59 422次阅读
    浅切多道切割工艺对晶圆 TTV 厚度均匀<b class='flag-5'>性</b>的<b class='flag-5'>提升机</b>制与参数优化

    【书籍评测活动NO.62】一本书读懂 DeepSeek 全家桶核心技术:DeepSeek 核心技术揭秘

    析和前瞻的行业洞察,技术人员、研究人员和大模型相关技术爱好者提供了宝贵的学习资料。 本书目录结构 第1章介绍 DeepSeek 的一系列
    发表于 06-09 14:38

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    视觉巡线,展示了如何从数据采集、模型训练机器人部署的完整流程。 值得注意的是,深度学习模型的实时机器人计算资源提出了较高要求,优化模型
    发表于 05-03 19:41

    提升机操作说明

    纯逻辑提升机VFD简易操作说明
    发表于 01-13 13:54 0次下载

    《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

    章深入分析了DNN的安全威胁。逃逸攻击通过向输入数据添加人眼难以察觉的扰动,诱导模型做出错误判断。投毒攻击则通过污染训练数据集,在模型学习阶段植入后门。探索攻击更具隐蔽,它利用模型决策边界的薄弱环节
    发表于 01-04 01:15

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    近年来,人工智能领域的大模型技术在多个方向上取得了突破的进展,特别是在机器人控制领域展现出了巨大的潜力。在“具身智能机器人大模型”部分,作者研究并探讨了大模型如何
    发表于 12-29 23:04

    【「具身智能机器人系统」阅读体验】1.初步理解具身智能

    现状和前沿研究,详细介绍大模型的构建方法、训练数据、模型架构和优化技术。 第4部分(第10章到第13章)深入探讨提升机器人计算实时、算法安全
    发表于 12-28 21:12

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    和经验积累,使机器人能够自主发现工艺规律,优化作业参数。家庭服务机器人则采用混合任务规划策略:将预训练的基础技能与实时规划相结合,灵活应对开放环境中的各种情况。 第9章深入探讨了元学习
    发表于 12-24 15:03

    充分考虑设备的体验易用 蓝鹏设计部将这一理念贯穿于整个研发过程

    设计部还充分考虑了设备的易用。他们深知,一个易于使用的设备能够降低用户的学习成本,提高用户的使用效率。因此,在研发过程中,设计部注重从以下几个方面提升设备的易用
    发表于 12-24 14:07

    【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

    ,数据对于训练增强和优化机器人能力的深度学习模型至关重要。 从财务上讲,用户数据对互联网公司具有重要价值,估计每个用户 600 美元,考虑到大规模商业化后每个机器人的估计成本
    发表于 12-24 00:33