0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中国人民大学孟小峰教授团队发布2018中国隐私风险指数

电子工程师 来源:lq 2019-02-11 14:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,抖音发布公告表示新用户无法以微信授权登录,也即抖音登陆被微信封杀了。而微信回应称,这么做是为了保护用户隐私。

这一事件无疑给愈演愈烈的“头腾”大战加了一把火,也将互联网时代的用户隐私话题再一次被提上了风口浪尖。

大规模数据收集问题日益严重,造成诸多隐私风险,并引发了大量社会问题。政府立法立规和企业隐私治理是解决该问题的重要途径。然而,目前政策法规和企业规范的制定仍亟需客观依据。

基于此,中国人民大学网络与移动数据管理实验室与国内最大的移动大数据服务商极光合作(由极光提供数据支持),基于3000万移动设备的App数据构建隐私风险量化模型,制定了中国隐私风险指数体系并总结形成2018年度《中国隐私风险指数分析报告》,可以为我国相应的法律法规和行业规范制定提供客观依据。

针对这次抖音和微信的争端,报告主创团队表示,“大战”的双方——“今日头条”和“腾讯”两家互联网巨头都是国内用户数据获取量比较多的App主体公司。

从整体上来看,该报告试图揭示以下问题真相:

数据都去哪儿了?

隐私换服务?哪些App更容易泄露用户隐私?

看看你的家乡排第几?中国地域隐私风险呈现何种差异?

你中枪了吗?高隐私风险职业有哪些?

网上冲浪需谨慎?哪些行为正加剧用户隐私风险?

中国隐私风险指数

中国人民大学信息学院孟小峰教授团队(网络与移动数据管理实验室)经过近一年的深入研究,发布了2018年度《中国隐私风险指数分析报告》,这是国内乃至世界上首例对大规模移动用户隐私风险量化的研究成果。

中国隐私风险指数是一个反映我国在特定时段内数据拥有者(移动用户)因个人数据被收集者(App开发者)获取而面临的隐私风险及数据收集者造成的隐私风险相对数的宏观指标,用来反映不同移动用户个体或群体面临隐私风险的差异。

模型思想

本报告对移动场景下的隐私风险进行分析并量化,以具体数值揭示隐私风险程度相对大小。隐私风险量化指通过识别用户的泄露数据源,基于从该数据源泄露数据的可能性及泄露后对用户隐私产生的危害综合评估用户的隐私风险程度。

通过调研,权限分析是最简单有效的App隐私风险分析方法,其基本思想是移动用户数据是通过App权限请求而泄露的,相应地,数据收集者也是基于App权限权限来获取用户数据的。进而,该报告从移动场景下两大数据主体——数据拥有者(移动用户)、数据收集者(本报告仅讨论App开发者)角度入手,构建基于权限的隐私风险量化模型。

指数体系

基于数据拥有者(移动用户)和数据收集者(App开发者)的隐私风险量化结果,本报告进一步制定中国隐私风险指数体系,从数据收集者角度揭示移动用户数据的流向,并从自然属性、社会属性、行为属性等维度揭示不同数据拥有者群体的隐私风险特征,最终分析汇总成《中国隐私风险指数分析报告》。

数据集

本报告数据集由基于中国现有333个地级行政区分层抽样的约3000万(30,907, 758)样本用户的App使用数据、162个维度的用户属性画像数据(自然属性、社会属性、地域信息及行为属性等)、通过爬取第三方应用网站得到近30万( 294,358 )个App数据(App名称、类别、开发者、版本、权限、大小、评分等)组成。

注:本报告中的用户数据均来源于匿名处理后的移动设备数据。

中国隐私风险指数分析流程

数据都去哪儿了?前10%数据收集者获取99%权限数据

截至2018年6月,数据集中全部用户通过使用App共产生约131.98亿份权限数据。信息完备的约16.47万款App对应约12.23万数据收集者,这些数据收集者共获取约90亿份权限数据。从获取隐私权限数据份数量级上可将数据收集者划分为亿级、千万级、百万级直至个级权限数据获取收集者,对上述不同级别的数据收集者进行统计分析,前10%数据收集者获取了99%的权限数据!

现实世界中常见的“二八定律”反映在虚拟世界中更为残酷,数据收集的垄断现象极为严重。数据“巨头”的统治地位相比经济“巨头”更加明显。

数据收集者权限数据获取分布

前0.01%、前0.1%、前1%、前5%、前10%

隐私换服务?这几类App最容易泄露你的隐私

本报告内App共有21类(不包括“其他类”),不同类别App由于自身功能的需要而请求不同的权限。此外,再加上不同人群偏向使用App的不同,使得不同人群隐私风险指数呈现差异。

因此本报告对21类App固有的权限请求状况进行分析,并对其在用户集内的权限数据获取状况进行统计,结果表明,社交类、旅游出行类、工具类、购物类和理财类App平均获取用户数据最多,更容易泄露用户隐私。相反地,儿童类、娱乐类、安全类App则较为安全。

看看你的家乡排第几?全国各省隐私风险排名出炉!

据2016年国务院发展研究中心《地区协调发展的战略和政策》提出的八大综合经济区(东北综合经济区、北部沿海综合经济区、东部沿海综合经济区、黄河中游综合经济区、大西北综合经济区、大西南综合经济区、长江中游综合经济区和南部沿海经济区)构想,本报告对各经济区隐私风险指数进行分析,结果表明,东部、南部沿海以及大西南地区隐私风险指数偏高,黄河中游、北部及西北地区隐私风险则偏低。

八大综合经济区隐私风险

进一步,本报告具体分析全国34个省级行政区和333个地级行政区隐私风险指数后发现,经济发达省份和旅游省份隐私风险相对较高,中等发达省份隐私风险普遍较低。

除港澳台地区外,高隐私风险的省份前三位依次为:上海市、云南省、浙江省;低隐私风险的省份前三位依次为:河南省、甘肃省、山西省。港澳台地区隐私风险排名为香港特别行政区>澳门特别行政区>***省,考虑到这三个地区App使用偏好与内地存在差异(如社交软件常用Facebook,Instagram等)的原因,故不与内地各省市进行比较。

中国隐私风险指数地图

你中枪了吗?十大高隐私风险职业

基于2015版《中华人民共和国职业分类大典》,本报告将用户职业按粒度划分为三级。一级职业是粒度最大的职业划分,包括5大类:(1)专业技术人员;(2)办事人员和有关人员;(3)商业/服务业人员;(4)农/林/牧/渔/水利业生产人员;(5)生产/运输设备操作人员及有关人员。二级职业是粒度中等的职业划分,每个一级职业均对应多个二级职业。三级职业是粒度最小的职业划分,本报告的数据集中涉及其中25类。

对于五类一级职业,隐私风险指数由高到低依次为生产/运输设备操作人员及有关人员、商业服务人员、农/林/牧/渔/水利业生产人员、专业技术人员、办事人员和有关人员;二级职业中,工程技术人员隐私风险指数最高,运输服务人员的隐私风险指数最低;而十大高隐私风险的三级职业由高到低依次为IT工作者、销售人员、律师、司机、人力资源人员、保险代理人、建筑人员、个人店主、装修人员和会计。

网上冲浪要小心!这些行为正在加剧你的隐私风险

本报告通过对购物偏好、教育行为、直播行为、社交习惯、贷款倾向、游戏爱好、彩票倾向、阅读倾向、新闻倾向、理财对象、住宿习惯和出行方式这12类共计91种用户行为的隐私风险指数加以分析后发现,具有外宿、贷款倾向行为的人群隐私风险普遍较高,而爱好游戏、阅读的人群隐私风险偏低;此外,不同教育行为、直播行为和新闻倾向的人群隐私风险指数差异较大。

12类行为属性隐私风险指数总体分析

社交习惯

偏好与陌生人互动的社交人群隐私风险普遍偏高,而熟人社交、校园社交人群隐私风险较低。

社交习惯指人们经常使用的社交App类型,包括人脉社交、匿名社交、陌生人社交、同志社交、情侣社交、妈妈社区、同城交友、校园社交、熟人社交、婚恋交友10种属性。偏好与陌生人互动的社交人群隐私风险偏高,如同城社交、匿名社交及婚恋交友等,且这些社交方式的隐私风险差异不大,熟人社交、校园社交人群隐私风险偏低。

直播行为

喜欢收看旅游直播、美妆直播节目的人群隐私风险指数偏高,收看电视直播的人群隐私风险指数最低。

直播行为指移动用户常收看的网络视频直播类型,包括旅游直播、体育直播、明星直播、美妆直播、cos直播、秀场直播、社交直播、电视直播、教育直播、游戏直播10种属性。分析发现,喜欢收看旅游直播、美妆直播节目的人群隐私风险指数偏高,收看电视直播的人群隐私风险指数最低。cos直播、体育直播行为隐私风险分列三、四位,而收看明星、教育、秀场、社交和游戏直播的人群隐私风险差异不大。

总结

本报告从数据拥有者(移动用户)和数据收集者(App开发者)两个角度定量评估隐私风险,并基于分层抽样得到的约3000万移动设备数据集构建出中国隐私风险指数体系,形成《中国隐私风险指数分析报告》。本报告主要结论如下:

大规模数据收集现状:数据收集垄断现象极为严重。前10%的数据收集者获取了99%的权限数据,比现实世界财富获取的“二八定律”更为残酷。

App类别数据收集特征:社交类、旅游出行类、工具类、购物类和理财类App平均获取用户数据最多,更容易泄露用户隐私。相反地,儿童类、娱乐类、安全类App则较为安全。

区域隐私风险指数:东部、南部沿海以及大西南地区隐私风险指数偏高,黄河中游、北部及西北地区隐私风险则偏低。经济发达省份和旅游省份隐私风险相对较高,中等发达省份隐私风险普遍较低。

人群隐私风险指数:高隐私风险职业前三名依次为IT工作者、销售人员、律师。高收入高消费人群隐私风险最高,低收入中等消费人群隐私风险最低。

行为隐私风险指数:具有外宿、贷款倾向行为的人群隐私风险普遍较高,而爱好游戏、阅读的人群隐私风险偏低;此外,不同教育行为、直播行为和新闻倾向人群隐私风险指数差异较大。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • APP
    APP
    +关注

    关注

    33

    文章

    1594

    浏览量

    76139
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26262

原文标题:社交类App更易泄露用户隐私,上海、云南隐私风险最高 | 中国人民大学孟小峰教授团队发布2018中国隐私风险指数

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    意优科技亮相2026中国人形机器人生态大会

    4月17日至19日,由中国机器人网、上海汽车会展中心主办的“2026中国人形机器人生态大会”在上海汽车会展中心拉开帷幕。
    的头像 发表于 04-23 17:29 1394次阅读

    芯科技与中国人民大学共研AI安全推理一体机

    近日,数智经济创新发展环省行暨苏州高新区数智产业融合发展大会顺利举行。会上,苏州芯科技股份有限公司与中国人民大学苏州人工智能学院签约,双方将围绕“AI+数据安全”方向,共同研发AI安全推理一体机。
    的头像 发表于 04-14 14:24 278次阅读

    华为携手北京理工大学软国际教育推出全球首个人工智能实践实验室

    能教学高质量发展研讨会,在北京理工大学良乡校区隆重召开。来自北京大学、北京航空航天大学中国人民大学、北京交通大学、西北工业
    的头像 发表于 03-24 10:51 526次阅读

    云知声荣登2025胡润中国人工智能企业50强榜单

    1月19日,全球权威榜单编制机构胡润研究院正式发布《2025胡润中国人工智能企业50强》榜单。云知声(股票代码:09678.HK)凭借其在通用人工智能和语音识别与交互领域深厚的技术积累、领先的行业解决方案以及广泛的商业化落地成果,成功入选并位列榜单前30强,持续稳居
    的头像 发表于 01-23 17:15 904次阅读

    上汽大众荣膺2025中国工业碳达“领跑者”企业

    12月27日,由中国工业经济联合会主办的第四届中国工业碳达论坛在青岛召开。上汽大众凭借在绿色低碳转型的卓越实践,荣膺2025中国工业碳达
    的头像 发表于 01-06 10:07 461次阅读

    曙光云荣获WIA2025创新奖

    近日,由亿欧主办、北京科技大学中国人民大学数据与人工智能研发实验中心等组织支持的“WIM2025创新者年会”在北京举办,大会汇聚千余位行业代表,共话未来产业的新增长与新格局。凭借在云安全、算力基础设施与可信技术体系建设方面的持续创新,曙光云荣获“2025创新奖(WIA2
    的头像 发表于 12-18 17:44 1259次阅读

    奕斯伟计算荣登2025全球独角兽企业500强榜单

    近日,由独角兽工程院联合中国人民大学中国民营企业研究中心、清华大学新质生产力研究院、北京隐形独角兽信息科技院和浙江清华长三角研究院独角兽企业研究中心共同发布的《2025全球独角兽企业5
    的头像 发表于 12-18 13:50 582次阅读

    中国人民解放军总医院第五医学中心:研究开发的metaEVchip生物传感策略可用于血清超灵敏的sEV分析

    纳米等离子体超表面技术以其高灵敏度而闻名,在癌症检测领域备受关注。然而,传统生物传感方法的数据处理和分析效率低下,阻碍了其潜力的发挥。   2025年9月23日,中国人民解放军总医院第五医学中心Li
    的头像 发表于 11-24 16:29 789次阅读
    <b class='flag-5'>中国人民</b>解放军总医院第五医学中心:研究开发的metaEVchip生物传感策略可用于血清<b class='flag-5'>中</b>超灵敏的sEV分析

    中国科研团队发布稀土材料最新成果

    据央视新闻报道中国科研团队发布稀土材料最新成果;日前又黑龙江大学、清华大学和新加坡国立大学合作完
    的头像 发表于 11-24 14:25 808次阅读

    思必驰受邀出席2025人工智能+大会

    》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院、赛迪研究院人工智能研究中心、中关村发展集团联合主办。
    的头像 发表于 11-20 10:26 588次阅读

    芯盾时代荣登AI100应用标杆榜单

    11月16日,由国家高新区人工智能产业协同创新网络、中央广播电视总台《赢在AI+》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院、中关村发展集团等联合主办的2025人工智能+大会主论坛在北京盛大举行。
    的头像 发表于 11-19 18:03 1888次阅读
    芯盾时代荣登AI100应用标杆榜单

    主线科技亮相2025中国智能产业大会

    2025年8月30-31日,由中国人工智能学会主办,工信部中小企业发展促进中心、常州市人民政府支持的第十四届中国智能产业大会与吴文俊人工智能创新大会在江苏常州开幕。
    的头像 发表于 09-03 18:08 1156次阅读

    中国人民大学,清华大学:研究用于自供电洪水报警的水触发传感器

    1a,蓝线)。这是过去四十年来全球主要洪水数量增加约700%的主要原因(方案1a,红点)。此外,全球城市化的加速导致世界各地越来越多的地区面临更高的洪水风险(方案1b)。统计数据表明,近年来,无论是发达国家还是发展中国家,洪水
    的头像 发表于 07-17 18:56 562次阅读
    <b class='flag-5'>中国人民大学</b>,清华<b class='flag-5'>大学</b>:研究用于自供电洪水报警的水触发传感器

    Gartner 发布2025年中国人工智能十大趋势

    本文来源:Gartner公司Gartner发布2025年中国人工智能(AI)十大趋势。企业不应流连于夸大其词的宣传或陷入到过度炒作所带来的恐惧,而是应该关注AI的可持续的发展路径、实际的经济效益
    的头像 发表于 06-30 11:20 1448次阅读
    Gartner <b class='flag-5'>发布</b>2025年<b class='flag-5'>中国人</b>工智能十大趋势

    2025年度先导智算专项中国人民大学校内赛启动

    近日,“2025年度先导智算专项中国人民大学校内赛”正式启动。赛事以 “智能计算,智启未来” 为主题,旨在从系统能力、工程能力、创新能力三大维度激发中国人民大学学生潜能,培养面向未来的智能计算拔尖人才。
    的头像 发表于 06-06 13:54 1055次阅读