0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于差分隐私的数据匿名化隐私保护模型研究介绍

lhl545545 来源:FreeBuf 作者:FreeBuf 2020-10-11 10:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

匿名化的前世今生

数据匿名的社会意识应该是近几年才日渐扩散的,但其实来自技术层面的畅想与实践早就开始了。

实验室总是先走一步,1997年,美国学者Samarati和Sweeney提出了k-anonymity匿名模型,为后续各种技术解决方案的涌现开了先河。当然,届时,数据匿名这个话题更多是停留在技术圈内的狂欢。

随着大数据、智能技术近年的发展与渗透,数据泄露、隐私侵犯等问题日渐凸显,并且受影响的群体日渐几何级增长。一方面数据作为智能时代的基石,不可能因噎废食,完全放弃,另一方面,政府、企业、个人都因该问题而持续困扰,市场格局也容易产生波动,这于长远发展不利。

此时,匿名化技术成为可以折中的方案。不过,数据匿名化需要技术投入,如果仅靠企业主观驱动,效果有限。所以,整个匿名数据的发展中,真正打破僵局的是法律领域的关注。

最为代表的则是令互联网企业心有余悸的GDPR。2018年正式实行的GDPR,将个人数据的保护力度提至前所未有的高度,亦对数据处理企业等主体施加了甚为严苛的保护义务和法律责任。其中,有一条,GDPR提到:控制者在确定处理方式和处理过程中,应当采取适当技术和组织措施,诸如假名化(pseudonymisation)处理,将额外数据与个人数据分别保存,除非使用额外数据,否则个人数据无法指向特定数据主体。

显然,GDPR白纸黑字地将个人数据的保护上升到法律层面,这已经将此前数据使用过程中涉及的大部分暧昧地带清晰化。此外,真正具有威慑力的是其“残忍”的惩罚力度。众所周知,如果科技巨头越雷池一步, GDPR是真的会开出开天价罚单。

最有意思的案例即是,GDPR开始生效的第一天就“开门红”,一下起诉了两大科技巨头:Facebook和谷歌。两家公司被指控强迫用户同意共享个人数据,且分别面临39亿欧元和37亿欧元(共计约88亿美元)的罚款风险。

当然除了GDPR,各政府都相继出台了相关严厉的个人数据保护法。如英国更新了数据保护法案,加上了个人数据的重视力度,中国也出台了数据安全法草案,明确了保护责任。,FTC在2012年发布的隐私保护指南中更是扩大了个人数据的边界,突破了传统定义中的与具体的自然人相关联,扩展到了用户所使用设备标识等。

在这样的背景下,对于企业来说,天价罚单是割肉之痛,政府的监管是不可逾越的红线,此外,用户隐私保护意识的觉醒也是不可推辞的需求。

GDPR在对匿名化的界定中也提到:“匿名化是指将个人数据移除可识别个人信息的部分,并且通过这一方法,数据主体不会再被识别。匿名化数据不属于个人数据,因此无须适用条例的相关要求,机构可以自由的处理匿名化数据”。

数据匿名则成为了许多企业或者数据应用主体的重点投入方向。有业内专家表示,匿名数据的收集主要用于帮助公司发现产品错误,这是互联网通过分析非个人可识别信息来改善整体产品体验最常见的解决方案之一。

数据匿名的“bug”

那么,常见的数据匿名方式有哪些?广义上可以分为两类:一是扰动方式,即让原始数据值失真,如数据屏蔽脱敏、噪声添加等,二是非扰动方式,即使数据集不完整,通过按照在记录个体层面维持数据真实性的方式改变在净化数据集中报告数据值的粒度来工作,如数据抑制和数据泛化。前文提到的k-anonymity匿名模型则是非扰动的一种重要方法。它要求发布的数据中存在一定数量(至少为k) 的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的具体个体,从而保护了个人隐私。

数据匿名一直在发展,问题也逐渐显露。所谓,“道高一尺魔高一丈”,匿名化一一定程度上保护了隐私,但“有心人”依旧可以从匿名数据中进行身份确认。

一位德国研究员在曾第33届Chaos Computer Club会议上公布了自己的研究成果:尽管是已经匿名化的点击流,也可以顺藤摸瓜找到用户清晰画像,数量少于十个的不同域名就足以让你暴露。披着匿名的外衣,这些数据被称为“Dark Data”,是非常容易滋生邪恶的新孕育地。

此外,去年,英国Nature Communications杂志发表的一项研究表示,英国科学家利用一种新开发的统计方法发现,一个人的身份可以从一个不完整的匿名化数据库中被识别出来。研究人员开发了一个机器学习模型,使用邮编、性别、出生日期三个信息,有81%的概率可以在“匿名”数据集中准确地追踪到某一个人。

事实证明,数据匿名方法不仅面临自身技术迭代更新的压力,也有新技术不断带来的冲击,如人工智能相关算法可能利用零星数据可以训练出较为精准的用户画像。

基于差分隐私的方案

道阻且长,行之将至。目前法律、市场、技术各方面都为数据匿名做好了一定的基础建设,接下来则是需要更多的投入与更新。首先,从此那个参与角色的角度来看,依旧需要政府组织牵头,从法律层面为整个业态施加强行规范化的压力,企业则需要更多资源投入匿名化建设,而个人则需从日常细节上提升网络隐私意识,如有意识地使用匿名化浏览器、及时清理清除cookie和Web数据等,

另外,则是来自技术角度的迭代更新,针对安全性不足的数据匿名现状,已经出现了基于差分隐私的数据匿名化隐私保护模型研究。差分隐私(differential privacy)是密码学中的一种手段,旨在提供一种当从统计数据库查询时,最大化数据查询的准确性,同时最大限度减少识别其记录的机会。

实际上,差分隐私也利用了统计学。该技术可以实现:向一个人的使用习惯样本中增加噪声,保证数据相对模糊与匿名,随着越来越多人呈现出相同的使用习惯,开始识别总结出共性。一个人的数据可能不准确,但是大量用户的数据可以得出相对准确的结论。这种情况下,即使有人攻击了数据库,也只能看到系统化的共性信息,不能精确识别具体的个人信息。苹果、Facebook、华为都在用该技术来来帮助发掘其大量用户的使用习惯。

值得一提的是,《MIT科技评论》评选的2020年十大突破技术中,差分隐私榜上有名。

不过,由于差分隐私是一项仍在探索中的技术。门槛较高,所以投入成本也想要较高。其处理过程对于人才资源的需求较大,同时也带来新的问题,多人的介入与隐私保护也会出现一定的冲突。为解决此问题,市面上一些企业注入了自动化机器学习的方法。

显然,隐私保护问题的解决一定是多学科、多技术流派融合的。

唯一不变的就是变化,“安全是动态话题”已经是老生常谈,数据隐私的安全也是一样。匿名数据只是为目前的数据裸奔问题提供了一个相对明朗可行的解决方法,并不是绝对安全的保护屏障。我们能做的只有随变化而变化,甚至是走在变化的前面。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7315

    浏览量

    93999
  • 人工智能
    +关注

    关注

    1813

    文章

    49757

    浏览量

    261677
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    特斯拉的“哨兵模式”为何被告?解析自动驾驶隐私保护出路

    引言自动驾驶技术正加速重塑未来交通格局,成为全球科技与产业竞争的核心赛道。然而,技术迭代的背后,数据搜集与隐私保护的矛盾日益凸显。自动驾驶系统的研发与测试高度依赖海量真实场景视觉数据
    的头像 发表于 11-28 17:32 941次阅读
    特斯拉的“哨兵模式”为何被告?解析自动驾驶<b class='flag-5'>隐私</b><b class='flag-5'>保护</b>出路

    发布元服务配置隐私声明

    元服务必须先使用AGC的隐私声明托管服务生成自己的隐私声明,才能在版本信息页面选择到。详细内容参见配置隐私声明(元服务)和配置用户协议。 登录AppGallery Connect,点击“APP与元
    发表于 11-25 11:24

    发布元服务配置隐私说明

    如果检测到元服务中涉及获取敏感隐私权限或者使用受限开放权限,需要填写“应用隐私说明”。 注意 如果软件包中声明使用了受限开放权限,请确保创建的发布Profile也申请了对应权限,否则元服务审核时将会
    发表于 11-24 15:19

    国际权威认证加持!“全球Robotaxi第一股”文远知行筑牢隐私安全屏障

    在自动驾驶技术飞速发展的当下,用户隐私数据安全已成为行业关注的核心议题。近日,“全球Robotaxi第一股”文远知行传来重要消息——其正式通过国际权威机构 TÜV NORD 北德集团的严格审核
    的头像 发表于 11-02 09:34 360次阅读
    国际权威认证加持!“全球Robotaxi第一股”文远知行筑牢<b class='flag-5'>隐私</b>安全屏障

    如何保障远程运维过程中的数据安全和隐私

    LZ-DZ100背面 在分布式光伏集群的远程运维中,数据安全和隐私保护面临多重风险,包括 传输过程中的窃听 / 篡改、未授权访问控制指令、设备固件被恶意植入、敏感数据(如站点位置、运行
    的头像 发表于 08-22 10:26 604次阅读
    如何保障远程运维过程中的<b class='flag-5'>数据</b>安全和<b class='flag-5'>隐私</b>?

    保护隐私!树莓派上安装和配置 Pi-hole !

    什么是Pi-hole?https://pi-hole.net/Pi-hole是一款强大的全网络广告拦截器,可提升所有连接设备的隐私保护和性能表现。Pi-hole是一种基于DNS的全网络广告拦截器,在
    的头像 发表于 08-08 14:59 1412次阅读
    <b class='flag-5'>保护</b><b class='flag-5'>隐私</b>!树莓派上安装和配置 Pi-hole !

    使用PMUT传感器的独特价值:保护隐私,重塑感知边界

    随着对隐私保护的全球性法规日益严格:以及对智能设备在复杂多变环境中鲁棒性、可靠性和成本效益要求的不断提高PMUT传感器技术的战略价值正加速显现将成为驱动下一代智能人机交互、环境感知与自动
    的头像 发表于 08-07 11:08 681次阅读
    使用PMUT传感器的独特价值:<b class='flag-5'>保护</b><b class='flag-5'>隐私</b>,重塑感知边界

    大成建设(Taisei)图像数据隐私保护与AI开发协同案例解析

    基于数字转型下的图像数据隐私保护与AI开发难题,本文以Taisei公司为例,详解客户实际需求,匹配隐私
    的头像 发表于 07-30 10:23 539次阅读
    大成建设(Taisei)图像<b class='flag-5'>数据</b><b class='flag-5'>隐私</b><b class='flag-5'>保护</b>与AI开发协同案例解析

    电商API合规性:确保数据隐私与法规遵守

    性已成为企业生存和发展的关键挑战。不合规的API可能导致数据泄露、巨额罚款(如GDPR最高可达2000万欧元或年营收4%)、品牌信誉受损甚至法律诉讼。本文将深入探讨如何通过系统方法确保电商API的数据
    的头像 发表于 07-16 10:40 224次阅读
    电商API合规性:确保<b class='flag-5'>数据</b><b class='flag-5'>隐私</b>与法规遵守

    【HarmonyOS 5】鸿蒙应用隐私保护详解

    【HarmonyOS 5】鸿蒙应用隐私保护详解 ##鸿蒙开发能力 ##HarmonyOS SDK应用服务##鸿蒙金融类应用 (金融理财# 一、前言 在今天这个手机不离手的时代,我们每天用手机支付
    的头像 发表于 07-11 18:30 972次阅读

    干货分享 | 从云端到单机的数据匿名全攻略

    数据驱动决策时代,企业面临隐私合规与数据利用的双重挑战(如PIPL、GDPR等隐私规定要求)。如何在聚焦效率与合规平衡,助力汽车、零售等行业在保护
    的头像 发表于 06-04 09:53 661次阅读
    干货分享 | 从云端到单机的<b class='flag-5'>数据</b><b class='flag-5'>匿名</b><b class='flag-5'>化</b>全攻略

    AI时代的隐私护盾:三星Knox Vault如何构建数据安全防线

    日程节奏。 这种高度个性的体验提供了更多便利,同时也对隐私保护提出了更高要求。手机知道得越多,隐私安全责任就越重大。那么,如何确保私人数据
    的头像 发表于 05-29 15:43 523次阅读

    康谋方案 | 本地匿名化解决方案:隐私保护、自主掌控和高效运行!

    本地匿名化解决方案,以隐私和安全为核心设计原则,利用Terraform部署技术实现灵活自动扩展,确保高吞吐量与高效管理。该方案确保隐私保护、具备高灵活性与控制力,并支持离线操作,已广泛
    的头像 发表于 01-22 11:15 3820次阅读
    康谋方案 | 本地<b class='flag-5'>匿名</b>化解决方案:<b class='flag-5'>隐私</b><b class='flag-5'>保护</b>、自主掌控和高效运行!

    深度自然匿名隐私保护与视觉完整性并存的未来!

    在科技快速发展的当下,个人隐私保护的需求日益凸显。如何能在隐私保护的基础上,保持视觉完整性,从而推动企业开发与创新? 深度自然匿名
    的头像 发表于 01-15 15:57 4815次阅读
    深度自然<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:<b class='flag-5'>隐私</b><b class='flag-5'>保护</b>与视觉完整性并存的未来!

    【「大模型启示录」阅读体验】如何在客服领域应用大模型

    的功能和性能。因此,选择具有良好可扩展性的模型可以适应未来业务的发展需求。在客服领域,处理客户数据时可能涉及敏感信息。因此,在选择模型时需要考虑其安全措施和隐私
    发表于 12-17 16:53