0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

匿名和去识别化在数据隐私保护方面的重要性

如意 来源:读芯术微信公众号 作者:读芯术微信公众号 2020-09-16 15:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

匿名化是为了确保数据的隐私性,公司用它来保护敏感数据。这类数据包括:

私人数据

业务信息,如财务信息或商业秘密

机密信息,如军事机密或政府信息

匿名化为遵循个人数据相关隐私条例提供了范例,个人数据和业务数据的重合之处就是客户信息所在。但并非所有的业务数据都受监管,本文将重点讨论个人数据的保护。

匿名和去识别化在数据隐私保护方面的重要性

敏感数据类型示例

在欧洲,监管机构将任何与某人(如你的名字)有关的信息定义为“个人数据”。不论形式,任何关联到此人的信息都符合上述定义。从上世纪起,个人数据收集逐渐民主化,数据匿名化问题开始出现。随着隐私条例在世界各地开始生效,这件事尤显重要。

什么是数据匿名化,为何要关注它?

我们从经典定义开始。欧盟的《通用数据保护条例》(GDPR)是这样定义对匿名信息的:“与识别或可识别自然人无关的信息,或以数据主体不能或不再可识别的方式匿名提供的个人信息。”

其中,“可识别”和“不再”至关重要。这不仅意味着你的名字不应再出现在数据中,也意味着不能从剩余数据中发现你是谁,这与再认同(有时也叫去匿名化)过程有关。

同样,GDPR(契约中)陈述了一个重要事实:“……因此,数据保护不应适用于匿名信息”。所以,若你设法匿名数据,就不再受GDPR数据保护法的约束。

你可以执行任何处理操作,如分析或数据货币化。这带来了大量机会:

出售数据显然是首选用途。在世界各地,隐私保护法正在限制个人数据交易,而匿名数据为公司提供了另一种选择。

它带来了合作机会。许多公司为了创新或研究而共享数据,匿名数据有助于降低风险。

它还为数据分析和机器学习创造了机会。在保持兼容性的同时运行敏感数据的操作正变得越来越复杂,匿名数据为统计分析和模型训练提供了安全的原材料,前景一片光明。但实际上真正的匿名数据往往并不如愿。

数据隐私保护机制的范围

数据的隐私保护有一个范围。多年来,专家们研发了一系列集方法、机制和工具为一体的技术。这些技术生成了具有不同的匿名级别和不同再识别风险等级的数据。可以说,其范围涵盖了个人可识别数据乃至真正的匿名数据。

匿名和去识别化在数据隐私保护方面的重要性

数据隐私的范围

左端,有包含直接个人识别码的数据。通过这些元素,可以识别你的姓名、地址或电话号码。另一端,则是GDPR引用的匿名数据。

如你所见,这些数据有一个中间范畴。它处于可识别数据和匿名数据之间,即假名数据和去识别数据。请注意,其界定仍有争议。有些报告认为假名化是去识别化的一部分, 而另一些报告则将其排除在外。

生成这种“中间数据”的技术本身并无问题。它们能有效地将数据最小化。根据用例需求,它们将彼此关联,发挥用处。但切记,它们无法生成真正的匿名数据,它们的机制无法保证阻止再识别,所以将其生成的数据称为“匿名数据”是一种误导。

匿名和“匿名”

假名化和去识别化确实能在某些方面保护数据隐私。但根据GDPR的定义,它们无法生成匿名数据。

假名化技术从数据中删除或替换直接个人标识码,例如,从数据集中删除所有名称和电子邮件,你无法直接从假名数据中识别某人,不过可以间接识别。实际上,剩余数据通常会保留间接识别码,组合这些信息后,就能创建直接识别码,如出生日期,邮编,性别等。

就此而言,假名化在GDPR框架中有一个单独定义:“……以以下方式处理个人数据,即在不使用附加信息的情况下,数据不再可以归因于特定数据主体”。与匿名数据相反,假名数据符合GDPR的要求。

去识别化技术从数据中去除直接和间接的个人身份识别码。理论上,去识别化数据和匿名化数据之间的界限很简单。最新消息表明:有技术可保障永远无法再识别数据。这是一种“疑罪从无”的情况,去识别化数据在未识别之前是匿名的。每当专家设法重新识别那些最初未识别出的数据时,他们都进一步推动了发展。

数据重新识别不断重新定义匿名

上述机制类型对隐私保护没有同等效力,因此如何处理这些数据很重要。公司定期发布或出售他们声称“匿名”的数据,但当他们使用的方法不能保证“匿名”时,就会带来隐患。

众多事件表明,假名化数据这种隐私保护机制仍有缺陷。数据中的间接识别码会带来巨大的再识别风险。随着可用数据量的增长,相互参照数据集的机会也在增加:

1990年,麻省理工学院的研究生从去识别化医疗数据中重新确认了马萨诸塞州州长的身份,她将这些信息与公用人口普查数据相互参照来确定患者身份。

2006年,作为研究计划的一部分,美国在线公司(AOL)共享了去识别化搜索数据,研究人员能够将搜索查询与背后的个人联系起来。

2009年,作为比赛的一部分,网飞(Netflix)发布了一个匿名电影评级数据集,德克萨斯州的研究人员成功重新识别了用户。

同是2009年,研究人员仅利用公开信息就能预测出一个人的社会保险号。

最近研究表明,去识别化数据实际上可以被重新识别。比利时新鲁汶大学和伦敦帝国理工学院的研究人员发现:“使用15个人口统计属性,在任何数据集中,99.98%的美国人都能被正确地重新识别。”

另一项针对匿名手机数据的研究表明:“四个时空点就足以唯一识别95%的个体用户”。

技术日益进步,更多的数据正在被创建,研究人员正在努力划定去识别化数据和匿名数据之间的界限。2017年,研究人员发表论文称:“网络浏览历史只能通过公开数据链接到社交媒体上的个人资料。”

另一个令人担忧的问题是个人资料的泄露,越来越多的个人信息遭到泄露。ForgeRock消费者身份泄露报告预测,2020年的信息泄露数量将超过去年,仅美国,2020年第一季度就有超过16亿的客户记录被泄露。

分开处理的数据集无法重新识别,但与泄露数据结合起来,它会造成更大的威胁。哈佛大学的学生能够利用泄露的数据重新识别去识别化数据。

总之,那些我们所认为的“匿名数据”往往并不是真正的匿名数据。并非所有的数据净化方法都会生成真正的匿名数据。事事都各有优点,但没有一种能提供与匿名同等级别的隐私。随着数据量的不断增长,创建真正的匿名数据也越来越难,公司发布潜在可重新识别的个人数据的风险也在增加。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93968
  • 匿名
    +关注

    关注

    0

    文章

    6

    浏览量

    6879
  • 隐私保护
    +关注

    关注

    0

    文章

    301

    浏览量

    17078
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业数据管理平台的重要性体现在哪

    工业数据管理平台作为工业数字转型的核心基础设施,其重要性体现在对工业数据全生命周期的整合、分析与赋能上。它不仅是数据汇聚的“枢纽”,更是驱
    的头像 发表于 09-02 14:39 363次阅读

    120Ω的秘密:CAN总线终端电阻的重要性

    CAN总线作为一种广泛应用的工业通信协议,其终端电阻的作用不容忽视。本文将详细探讨CAN总线终端电阻的重要性及其在通信中的关键作用。CAN总线终端电阻的重要性CAN总线终端电阻顾名思义就是夹在总线
    的头像 发表于 08-08 11:35 786次阅读
    120Ω的秘密:CAN总线终端电阻的<b class='flag-5'>重要性</b>

    大成建设(Taisei)图像数据隐私保护与AI开发协同案例解析

    基于数字转型下的图像数据隐私保护与AI开发难题,本文以Taisei公司为例,详解客户实际需求,匹配隐私
    的头像 发表于 07-30 10:23 523次阅读
    大成建设(Taisei)图像<b class='flag-5'>数据</b><b class='flag-5'>隐私</b><b class='flag-5'>保护</b>与AI开发协同案例解析

    蓝牙随机化RPA更新的重要性和工作原理

    蓝牙™随机可解析私有地址(Bluetooth® Randomized RPA)更新功能已推出,该更新通过优化可解析私有地址的管理,提高了低功耗蓝牙设备的隐私和能效。本文将介绍蓝牙™随机化RPA更新的重要性、解释其工作原理,并为
    的头像 发表于 07-10 09:36 705次阅读
    蓝牙随机化RPA更新的<b class='flag-5'>重要性</b>和工作原理

    干货分享 | 从云端到单机的数据匿名全攻略

    在数据驱动决策时代,企业面临隐私合规与数据利用的双重挑战(如PIPL、GDPR等隐私规定要求)。如何在聚焦效率与合规平衡,助力汽车、零售等行业在保护
    的头像 发表于 06-04 09:53 649次阅读
    干货分享 | 从云端到单机的<b class='flag-5'>数据</b><b class='flag-5'>匿名</b><b class='flag-5'>化</b>全攻略

    安科瑞ARD系列电动机保护在数据中心的UPS系统中具的作用

    在当今数字、信息快速发展的时代,数据中心作为信息存储和处理的核心设施,其稳定性和可靠显得尤为重要。安科瑞ARD电动机
    的头像 发表于 04-27 16:42 422次阅读
    安科瑞ARD系列电动机<b class='flag-5'>保护</b>器<b class='flag-5'>在数据</b>中心的UPS系统中具的作用

    PCB拼板设计全解析:重要性、优势与应用实践

    一站式PCBA智造厂家今天为大家讲讲PCB拼板设计的重要性表现哪些方面?PCB拼板设计的基本概念及其重要性。在电子制造行业,SMT贴片工艺中,PCB拼板设计是一项极为关键的步骤。通过优化PCB拼板
    的头像 发表于 03-13 09:35 1072次阅读
    PCB拼板设计全解析:<b class='flag-5'>重要性</b>、优势与应用实践

    构建综合指挥调度系统的重要性

    构建综合指挥调度系统的重要性不言而喻,它对于提升应急响应速度、优化资源配置、加强跨部门协作、提高决策效率和确保公共安全等方面都具有至关重要的作用。以下是古河云科技构建综合指挥调度系统重要性
    的头像 发表于 02-06 16:56 880次阅读

    如何判定线性稳压器是否存在过热问题?工作温度范围的重要性影响多方面因素

    如何判定线性稳压器是否存在过热问题?工作温度范围的重要性影响多方面因素
    的头像 发表于 02-06 09:37 872次阅读

    康谋方案 | 本地匿名化解决方案:隐私保护、自主掌控和高效运行!

    本地匿名化解决方案,以隐私和安全为核心设计原则,利用Terraform部署技术实现灵活自动扩展,确保高吞吐量与高效管理。该方案确保隐私保护、具备高灵活性与控制力,并支持离线操作,已广泛
    的头像 发表于 01-22 11:15 3804次阅读
    康谋方案 | 本地<b class='flag-5'>匿名</b>化解决方案:<b class='flag-5'>隐私</b><b class='flag-5'>保护</b>、自主掌控和高效运行!

    深度自然匿名隐私保护与视觉完整并存的未来!

    在科技快速发展的当下,个人隐私保护的需求日益凸显。如何能在隐私保护的基础上,保持视觉完整,从而推动企业开发与创新? 深度自然
    的头像 发表于 01-15 15:57 4801次阅读
    深度自然<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:<b class='flag-5'>隐私</b><b class='flag-5'>保护</b>与视觉完整<b class='flag-5'>性</b>并存的未来!

    IPC发布双重重要性评估白皮书

    ),同时利用双重重要性评估(DMA)这一工具,实现企业的可持续增长和差异化竞争优势。 在该白皮书中,IPC详细阐述了双重重要性评估的核心概念,以及它如何帮助企业平衡经济、社会和环境三方面的考量,从而制定出更加全面、可持续的发展战
    的头像 发表于 12-23 17:28 1119次阅读

    PCB板元器件点胶加固的重要性

    PCB板元器件点胶加固的重要性PCB板元器件点胶加固在电子制造过程中起到了至关重要的作用,其重要性主要体现在以下几个方面:一、提高机械强度点胶加固可以显著降低电子元件的翘曲和变形现象,
    的头像 发表于 12-20 10:18 2411次阅读
    PCB板元器件点胶加固的<b class='flag-5'>重要性</b>

    电子连接器在自动设备中的重要性

    电子连接器在自动设备中扮演着至关重要的角色,其重要性主要体现在以下几个方面: 一、确保数据传输的稳定性和准确
    的头像 发表于 12-20 09:51 960次阅读

    耦合器在工业自动中的重要性

    耦合器在工业自动中扮演着至关重要的角色,尤其是光电耦合器(也称为光耦合器晶体管或光耦),其重要性主要体现在以下几个方面: 一、电气隔离与保护
    的头像 发表于 12-10 15:22 1478次阅读