0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为了不让AI带有歧视色彩,谷歌操碎了心训练模型

如意 来源:极客公园 作者:沈知涵 2020-11-03 10:47 次阅读

土耳其语的「他」和「她」没有性别的区分,统一用 O 表示。过去 Google Translate 在翻译 o bir doktor(ta 是一位医生)和 o bir hem?ire(ta 是一位护士)时,会把前者翻译成 He is a doctor,把后者翻译成 She is a nurse,只因为机器在学习数亿数据和某些「社会规律」之后,「偏向」把医生男性化,护士女性化。

看到这个问题后,Google 意识到要想办法更好地训练模型,让它变得更加「中立」。后来 Google Translate 以增加选项的方式规避了这个问题。

「当然,该解决方案仅适用于几种语言,仅适用几个有代表性的单词,但是我们正在积极尝试扩展它。」Tulsee Doshi 在 Google I/O’19 上说道。

这只是 Google 这家公司将先进技术与技术价值观合二为一的体现之一。上周 Meg Mitchel,Tulsee Doshi,Tracy Frey 三位谷歌科学家、研究学者向包括极客公园(id: geekpark)在内的全球媒体阐释了 Google 如何理解机器学习公平性,以及为了打造一个「负责任的 AI」,Google 做了哪些事情。

要让 AI 被人信任这件事情变得越来越重要。

「最近一次调研中,全球 90% 的受访高管都遇到过人工智能的伦理问题,因此有 40% 的人工智能项目被放弃。从企业的角度来看,对 AI 的不信任正在成为部署 AI 最大的障碍,只有在 AI 被负责任地开发出来并且取得终端用户信任的语境下,效率提升和竞争优势才会得到充分体现。」Tracy Frey 说,打造一个负责任的 AI 成为 Google 上下最重要的事情之一。

两年之前 Google 公布了 AI principles(人工智能原则),这些直指 AI 技术应用伦理的原则包括:

· 对社会有益(Be socially beneficial)

· 避免建立和加剧不公的偏见(Avoid creating or reinforcing unfair bias)

· 保障建立和测试安全性(Be built and tested for safety)

· 对人类负责(Be accountable to people)

· 建立并体现隐私保护原则(Incorporate privacy design principles)

· 支持并鼓励高标准的技术品格(Uphold high standards of scientific excellence)

· 提供并保障上述原则的可操作性(Be made available for uses that accord with these principles)

只是把这些原则停留在字面上没有意义,Google 为此形成了一个从理论到实践的「闭环」。Tulsee Doshi 和她的团队通过一些基础性质的研究建立和迭代 AI 原则、规范,作为闭环的中心,他们一边通过向高级顾问寻求改进建议,一边让产品团队(Chrome、Gmail、Cloud 等)来实施和反馈。

Tulsee 举了一个例子,Google 内部孵化器 Jigsaw 曾经开发了一个名叫 Perspective 的 API,它的工作就是在网络对话、评论中寻找各种各样的言论,自动评价它们是否带有仇恨、辱骂、不尊重等行为,从 0-1 代表「毒性」从低到高。

比如「我想抱抱这只可爱的小狗」和「这只小狗也太讨厌了吧」分别评分为 0.07 和 0.84。

当然机器也不是从一开始就「完美无瑕」。在 2017 年的 1.0 版本中,它给「我是直男」打分 0.07 分,给「我是同性恋」打分 0.84 分,与之相似的很多测试中,系统都被证实带着身份认知上的偏见。

为了提升机器学习的公平性,Google 内部研发了一项名为对抗训练(Adversarial Training)的技术——如何使机器学习模型对抗样本更鲁棒。2018 年开始,对抗训练开始应用在 Google 产品中。紧接着今年 11 月,Google 会将此应用在 TensorFlow 更加广泛的生态里。

「事实上,任何一位 Googler 都可以对一款产品、一份研究报告、一项合作进行 AI 原则审查。」Tulsee 说道。

比如去年,一位 Google 员工将照片跑在 Cloud Vision API 上时发现自己的性别被搞错了,而这违反了 AI 原则的第二条「避免建立和加剧不公的偏见」。

发生这样的失误很好理解,单单从外表一个维度,机器很难正确地判断出一个人的性别,所以后来 Google 干脆取消 Cloud Vision API 将图像中的人标记为「男人」或「女人」的标签功能。

Tracy Frey 称这是因为今天机器学习面临社会语境下的挑战比以前更多了。在 AI 深入社会的过程中,必然有人类的刻板印象和偏见被带入 AI,所以需要对模型进行迭代,保证其透明性和可解释性,找准模型性能和公平之间的平衡点。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5835

    浏览量

    103220
  • AI
    AI
    +关注

    关注

    87

    文章

    26338

    浏览量

    263943
  • 机器学习
    +关注

    关注

    66

    文章

    8094

    浏览量

    130513
收藏 人收藏

    评论

    相关推荐

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架,由谷歌的机器学习团队开发,用于构建和
    的头像 发表于 03-01 16:25 210次阅读

    谷歌模型训练软件有哪些?谷歌模型训练软件哪个好?

    谷歌模型训练方面提供了一些强大的软件工具和平台。以下是几个常用的谷歌模型训练软件及其特点。
    的头像 发表于 03-01 16:24 253次阅读

    谷歌模型训练软件有哪些功能和作用

    谷歌模型训练软件主要是指ELECTRA,这是一种新的预训练方法,源自谷歌AI。ELECTRA不仅
    的头像 发表于 02-29 17:37 380次阅读

    谷歌模型合成工具怎么用

    谷歌模型合成工具主要是指Dreamfusion,这是Google的大型AI图像模型Imagen与NeRF的3D功能相结合的一种技术。Dreamfusion是Dream Fields的演
    的头像 发表于 02-29 17:33 377次阅读

    谷歌发布全新AI模型Genie

    谷歌近日发布了其全新的AI模型Genie,这一模型彻底改变了我们与数字世界的互动方式。Genie不仅可以接收文本提示、草图或想法,还能将这些创意迅速转化为一个可互动和玩耍的虚拟世界。
    的头像 发表于 02-28 18:25 1108次阅读

    谷歌AI模型Gemma全球开放使用

    谷歌公司近日宣布,其全新的AI模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌AI领域的领先地位,还为其在全球范围内的
    的头像 发表于 02-28 18:12 682次阅读

    谷歌发布开源AI模型Gemma

    近日,谷歌发布了全新AI模型Gemma,这款模型为各种规模的组织提供了前所未有的机会,以负责任的方式在商业应用中进行分发。
    的头像 发表于 02-28 17:38 390次阅读

    谷歌发布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。这款模型能够将简单的文本提示、草图或初步想法迅速转化为一个可以互动和游戏的虚拟世界。这一突破性的技术无疑将改变人们创建和体验虚拟世界
    的头像 发表于 02-28 10:05 270次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06

    谷歌推出AI扩散模型Lumiere

    近日,谷歌研究院重磅推出全新AI扩散模型Lumiere,这款模型基于谷歌自主研发的“Space-Time U-Net”基础架构,旨在实现视频
    的头像 发表于 02-04 13:49 583次阅读

    谷歌发布多模态Gemini大模型及新一代TPU系统Cloud TPU v5p

    谷歌亦发布新一代TPU 系统——Cloud TPU v5p,以帮助训练尖端的 AI 模型。目
    的头像 发表于 12-12 10:50 787次阅读
    <b class='flag-5'>谷歌</b>发布多模态Gemini大<b class='flag-5'>模型</b>及新一代TPU系统Cloud TPU v5p

    Apple 预定 3 纳米芯片,谷歌云 A3 虚拟机将改变 AI 训练

    GPU 的 A3 GPU 虚拟机,加速 AI 模型训练速度 谷歌云近日宣布,他们将在下个月正式推出搭载 Nvidia H100 GPU 的 A3 GPU 虚拟机。这款 A3 虚拟机结
    的头像 发表于 08-31 13:00 393次阅读
    Apple 预定 3 纳米芯片,<b class='flag-5'>谷歌</b>云 A3 虚拟机将改变 <b class='flag-5'>AI</b> <b class='flag-5'>训练</b>

    训练好的ai模型导入cubemx不成功怎么解决?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 08-04 09:16

    NVIDIA AI 技术助力 vivo 文本预训练模型性能提升

    vivo AI 团队与 NVIDIA 团队合作,通过算子优化,提升 vivo 文本预训练模型训练速度。在实际应用中, 训练提速 60%
    的头像 发表于 05-26 07:15 442次阅读
    NVIDIA <b class='flag-5'>AI</b> 技术助力 vivo 文本预<b class='flag-5'>训练</b>大<b class='flag-5'>模型</b>性能提升

    什么是预训练AI模型

    训练 AI 模型是为了完成特定任务而在大型数据集上训练的深度学习模型。这些模型既可以直接使用,
    的头像 发表于 05-25 17:10 629次阅读