0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人脸识别爆发安全问题,IBM 真没拿面部数据集赚钱?

传感器技术 来源:YXQ 2019-04-07 17:37 次阅读

面部识别技术成为整个 AI 行业最为常见的技术应用之一;不过,在识别效率越来越高的同时,人们也开始担心面部识别技术发展过程中的隐私安全问题。比如说最近 IBM 利用 Flickr 下载的图片来进行面部识别训练,就引起了人们的质疑;NBC News 针对此事进行了详细的报道,雷锋网对这篇报道进行了不改变原意的编译。

近些年来,面部识别技术得到了长足发展,除了帮你解锁 iPhone,还能让执法机关在人山人海中“一眼”就认出犯罪分子,商店甚至用它来识别自己的“死忠”客户。不过,法律专家却警告称,大量未经允许滥用网络照片最终会画地为牢,反过来成为监控你的“帮凶”。

现在的面部识别技术还不完美,它工作时靠的是算法,目标则很简单——认出那张独一无二的脸。

想把这个任务完成好,技术人员就必须提前“喂给”算法“养料”,即天量的面部照片。那么这些照片从哪来呢?当然是互联网。

起初,算法学习的照片都会按照不同的标准进行分类,比如年龄、性别、肤色等,但经过一段时间的学习后,它的能力开始变得有些吓人了,于是法律和人权专家开始大声疾呼,他们担心技术人员对普通人照片的滥用会带来“反噬”效果。

“这是 AI 训练数据集背后的肮脏小秘密。技术人员可不管三七二十一,只要能用的照片他们都不放过。”纽约大学法学院教授 Jason Schultz 说道。

最近 IBM 公司也进了“暴风圈”,今年 1 月它们向研究人员分享了自己的数据集,包含了 Flickr 上近 100 万张照片,虽然 IBM 号称此举是为了减少面部识别的偏差。

了解真相后的摄影师们不愿意了,因为 IBM 在他们的作品上加了各种细节注释,包括面部几何结构、肤色等信息,而这些照片最终可能会成为面部识别算法的“养料”。

“我拍过的人可没想过,自己的照片居然会被用在面部识别算法训练上。”公关经理 Greg Peverill-Conti 气愤地说道,他有 700 多张照片被收录在了 IBM 的“训练数据集”中。“IBM 太草率了吧,它们怎么能不经同意就使用这些照片”。

IBM 公司 AI 研究主管 John Smith 则表示,公司“致力于保护个人隐私”,如果谁想从数据集中移除照片,尽管联系 IBM。

虽然 IBM 信誓旦旦的保证 Flickr 用户可以随时移除数据集中的照片,但事情哪有那么简单,这本就是个有来无回的“不归路”。因为 IBM 需要拍摄者发送想要移除图片的链接(光靠 Flickr 账号不管用),而它们却从没分享过到底这个数据集用了谁的 Flickr 照片,所以你大概率会被蒙在鼓里。

对于这个数据集,IBM 有自己冠冕堂皇的理由——它将用于学术工作,且担负着让面部识别变得更加公平的重任。当然,在网络照片滥用方面,IBM 并不是独一家,数十家其他研究机构或公司也在采集网络照片训练自己的面部识别系统。

一些法律专家认为,这不仅仅是对数百万人肖像权和隐私权的侵犯,它还加重了人们对面部识别技术的担忧,也许有一天执法部门会让它“双手沾满鲜血”。

面部识别技术的进化历程

面部识别工具刚刚诞生时,研究人员会付钱请人来试验室“帮忙“,这些人拿钱办事,将自己不同姿态和光照角度下的照片留了下来以供研究之用。不过,这样的方案成本高还浪费时间,因此早期的数据集往往只有数百个样本。

进入新世纪后,互联网飞速发展,研究人员突然意识到,面部识别的好时光来了,因为网上有天量的照片可供使用。

“直接打开搜索引擎,输入名人的姓名,然后下载各种 360 度无死角的照片既可。”美国国家标准技术局数据集采集人员 P. Jonathon Phillips 说道。

随着社交网络的兴盛和自媒体的发展,普通人的照片也突然多了起来。研究人员默认这些照片是对所有人开放的,有时他们甚至会从 YouTube 的视频中抓取面部图片。

由于工作的非经营性质,学术人员用起照片来绝对是近水楼台,因为他们能绕过版权问题了,而 Flickr 的性质更是让它们成了研究人员绝对的安全之选。

为了保证数据集的多样性,IBM 其实从 Flickr 上 Down 了超过 1 亿张照片,随后又精选了 100 万张有注释的面部照片。为了力求精确,它们甚至为这些照片定了 200 多种分类标准。

谷歌学术指出,这种研究方法在业内几乎已经是尽人皆知,因为有数百篇学术论文都在靠照片采集来佐证自己的论点,没人敢说自己是完全清白的,或者拿到了授权或同意。因此,面部识别准确性的提高和分析工具的进步主要就是靠这些“野路子”来的照片。

IBM 真没拿面部数据集赚钱?

“要想让面部识别系统超常发挥,训练数据必须足够多样化,而且覆盖范围足够广。”IBM 的 John Smith 说道。

在 IBM 看来,自己的数据集并未将图片中的人脸和具体的名字联系起来,这就意味着系统不会侵犯人们的隐私。不过,依然有人质疑 IBM 的动机,因为它们可是向政府出售过监控工具。

举例来说,911 袭击发生后,IBM 就将面部识别技术卖给了纽约警方,执法部门通过搜索监控录像就能识别出特殊的肤色或发色。IBM 还曾推出过“智能视频分析”产品,它们能通过监控摄像头给人们加标签(亚裔、黑人或白人)。

如今,IBM 则有了 Waston 视觉识别系统,通过图片算法就能识别出人的年龄和性别。配合正确的训练算法,客户就能从图片或视频中识别出特定的人。在被问到 Waston 用了什么训练数据时,IBM 称数据有多个来源,不过却拒绝披露具体的数据来源,并美其名曰保护知识产权。

一再逼问下,IBM 称从 Flickr 拿到的相片数据集仅用于研究,不会用来提升公司的商用面部识别工具。不过,有专家指出,类似 IBM 和 Facebook 这样的公司,其研发和商业运营部门之间的界限非常模糊,而且研发部门的知识产权均归 IBM 所有。因此,面部识别公司 Kairos 前 CEO Brian Brackeen 断言,即使学术部门研发的算法有其非商业化性质,这些算法最终还是会被拿来赚钱。

他还打了个形象的比喻,“你可以把它看做拿面部识别技术洗钱,公司将网上的照片洗成了自己的知识产权。”

“被选中”的摄影师们怎么想?

澳大利亚摄影师 Georg Holzer 将自己的作品上传 Flickr 是为了记录自己声明中的精彩瞬间,他也签署了创意认证,只要是非营利性项目,就能免费使用他的照片。不过,他没想到自己的照片会成为面部识别技术的“养料”。

“我了解技术能造成的伤害。”Holzer 说道。“当然,面部识别技术也有其积极的一面,但如果用得不对,它也能剥夺人的基本权利和隐私。我是无法接受这项技术广泛应用的。”

“我觉得 IBM 可不是家慈善公司,最终它们还是会用这项技术牟利,所以面部识别技术还是会进入商业市场。”Holzer 说道。

Dolan Halbrook 也有 452 张照片被 IBM 的数据集“侵吞”,他也认为 IBM 在使用这些照片时应该征得自己的同意。

当然,也有摄影师觉得自己的照片能被 IBM 选中并用在推动面部识别发展上是一大幸事。

瑞士的 Guillaume Boppe 就表示:“如果我的照片能帮助 AI 进化,降低探测错误率并最终提升全球安全指数,我举双手赞同。”

想从数据集中删图?没那么容易

如果你不同意 IBM 将自己的照片当成训练数据,也可以联系它们删除,但操作起来没那么容易。一位被抓取 1000 多张照片的摄影师忙活了半天,也只删除了 4 张照片,因为他无法找到所有照片的链接,而 Flickr 账号 IBM 可不认。

此外,即使从 IBM 的数据集中删除了照片,IBM 研究伙伴拿到的数据集也无法一并删除(已经有 250 多家组织和机构接入了 IBM 的数据集)。

显然,IBM 的数据集不是公共场所,没法想来就来想走就走。

好在,各国对隐私数据的保护正在加强。举例来说,欧洲就将照片看做“敏感个人数据”,如果 IBM 不按规定删图,可能就会被欧盟重罚。在美国,也有一些州有了相关规定,在不征得当事人同意的情况下采集、存储和分享生物信息属违法行为,而生物信息包含指纹、虹膜和面部几何结构等。

近期,芝加哥的律师 Jay Edelson 就向 Facebook 发起了集体诉讼,称其面部识别工具触犯了相关法律。

至于典型的法院判例,现在还是一片空白。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1666

    浏览量

    74257
  • 人脸识别
    +关注

    关注

    76

    文章

    3953

    浏览量

    80531

原文标题:面部识别技术背后,有什么“肮脏的小秘密”?

文章出处:【微信号:WW_CGQJS,微信公众号:传感器技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    面部表情识别:人工智能的新前沿

    监测、心理健康诊断等领域具有广泛的应用前景。 数据堂自制版权的系列数据集产品为“”人脸识别”这一技术路径的实现提供了强有力的支持。 2000人面部
    的头像 发表于 08-17 18:20 307次阅读

    面部表情识别的伦理问题与挑战

    数据集产品为“”人脸识别”这一技术路径的实现提供了强有力的支持。 2000人面部遮挡多姿态人脸识别数据
    的头像 发表于 08-17 18:10 283次阅读

    面部表情识别技术在安全领域的应用

    面部表情识别技术在安全领域具有广泛的应用。通过对面部表情的识别和分析,可以判断人的情绪状态和心理状况,从而为
    的头像 发表于 08-10 18:27 448次阅读

    人脸识别和指纹识别哪个安全

    人脸识别和指纹识别哪个安全? 随着科技的不断发展,越来越多的技术被应用到我们的生活中,人脸识别
    的头像 发表于 08-09 18:26 1692次阅读

    面部表情识别安全领域的应用

    面部表情识别安全领域有着广泛的应用,可以帮助安全系统更加精准地识别和判断人的的情绪和心理状态,从而提高
    的头像 发表于 08-08 22:33 328次阅读

    面部表情识别的伦理问题

    是一个重要问题。在应用面部表情识别技术时,需要确保数据安全性和隐私性。对于收集到的面部图像数据
    的头像 发表于 08-04 18:20 589次阅读

    人脸识别和指纹识别哪个安全人脸识别和指纹识别的利弊及风险

      人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪
    发表于 08-03 16:55 2316次阅读

    MCU人脸识别模型的设计注意事项和最佳实践

    本指南介绍了在训练和量化MCU友好的人脸识别模型时需要考虑的一些设计注意事项和最佳实践。近年来,面部识别技术在日常生活中变得无处不在。它让我们的生活变得更轻松的方式有很多,包括: ·
    发表于 08-02 08:58

    人脸识别技术在医疗行业的应用

    也可以发挥重要作用,例如通过对面部特征的分析和比对,可以确定治疗方案、监测治疗进展等。 在医疗行业中应用人脸识别技术需要注意多方面的问题,如数据的隐私和
    的头像 发表于 07-06 18:14 719次阅读

    人脸识别技术的优缺点及其在实际应用中的影响

    人脸识别技术作为一种生物识别技术,具有多种优点和缺点。优点包括非接触式、快速、方便、安全等,而缺点则包括准确性受限于光照、面部表情、
    的头像 发表于 07-06 18:07 771次阅读

    人脸识别技术的安全性和隐私保护

    方法,如数据加密、特征提取、生物特征识别等。数据加密可以通过对数据进行加密,保护数据的隐私和安全
    的头像 发表于 07-05 14:20 672次阅读

    人脸识别技术在社交媒体中的应用

    人脸识别技术不仅可以应用于安全防护、金融支付、门禁系统等领域,还可以应用于社交媒体中。社交媒体平台通过使用人脸识别技术,可以为用户提供更加个
    的头像 发表于 06-30 14:52 383次阅读

    人脸面部表情识别技术的挑战和未来发展

    人脸面部表情识别技术虽然取得了一定的成就,但仍然面临着一些挑战和问题。 首先,光照、姿态和表情等因素都会影响到面部表情的识别准确率,需要进行更加深入的研究和处理;其次,对于某些复杂的情
    的头像 发表于 06-06 16:53 416次阅读

    人脸面部表情识别的原理及其应用

    人脸面部表情识别是一种通过计算机视觉技术来分析人脸图像从而判断出面部表情的方法。该技术主要通过摄像头获取人脸图像,然后通过算法对
    的头像 发表于 06-02 17:57 2766次阅读

    人脸识别数据集应用和研究

    人脸识别数据集是指包含大量人脸图像和相应的文本描述的数据集。这些数据集可以用于训练和测试人脸
    的头像 发表于 04-21 16:19 701次阅读