0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

康谋分享 | 突破传统匿名化:先进技术解锁数据价值新维度

康谋自动驾驶 2025-02-19 09:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

海量数据的收集使得新旧企业能够利用机器学习技术开发新产品并革新旧产品。近年来,数据质量因直接影响了人工智能系统的性能和鲁棒性而备受关注。然而,这对通常通过破坏像素信息(如模糊化、马赛克等)来实现匿名化的方法提出了挑战,这些方法导致合规性与数据质量之间难以兼得。

我们探索了一种不是简单移除像素信息,而是对其进行自然替换的深度自然匿名化(Deep Natural Anonymization,DNAT)方法,致力于提高匿名化数据价值,助力企业开发创新。

一、匿名化数据的传统矛盾

DNAT能够检测人脸、车牌等可识别信息,并为每个对象生成人工替换。每个替换都尽可能匹配源对象的属性,但这种匹配是有选择性的,我们可以灵活控制保留哪些属性。

例如,对于人脸,保留性别和年龄等属性可能对后续分析至关重要。对于可识别信息以外的内容,不包含敏感个人数据的信息则保留不做修改。通过这种方式,DNAT成功打破了数据消除与匿名化之间的传统矛盾。

wKgZO2e1MhKAMci7AAQVaZi4spI058.png图1: 匿名化工具的比较,从左至右依次为:Facepixelizer,YouTube,Fast Redaction,DNAT,原图

为了衡量匿名化方法对数据质量的影响,我们从Labeled Face in the Wild(LFW)数据集中采样了图像。所有图像均取自测试集。我们比较了代表匿名化技术的四种不同的匿名化工具,图1显示了这些示例的一部分。

二、匿名化的结构一致性

首先,我们分析了图像在匿名化处理后的整体结构变化。为此,我们仔细研究了图像分割结果。图像分割是将图像的像素划分为多个片段的过程,每个片段代表一个对象类别。在我们的示例中,最重要的对象是个人资料图片中的人物和背景

图2和图3展示了LFW数据集中两位名人的分割图。这些分割图是由语义分割模型DeepLabv3+生成的,采用了官方TensorFlow存储库中的实现和模型权重。

wKgZO2e1MiSAVSZSAALCvOWb5YA092.png图2: AI Pacino DeepLabv3+ 分割结果对比

wKgZPGe1Mi-AcwIGAAJiAzAgOCc073.png图3: Reese witherspoon DeepLabv3+ 分割结果对比

从图2和图3中可以看出,传统匿名化方法的分割图明显退化,其中一些甚至完全错误。然而,深度自然匿名化(DNAT)保留了语义分割。分割图与原始图像几乎完全相同。从图3中可以看出,经过传统匿名化方法处理的人脸图像不仅产生了较差的分割边界,还使分割模型推断出原始图像中从未出现的新对象类别,如猫、狗或瓶子。

为了量化每种匿名化技术的影响,我们计算了整个测试集的平均交并比(mIOU)。计算是在不同方法生成的图像分割图与原始图像分割图之间进行的。结果如表1所示。

wKgZPGe1Mj-AXW_9AABLWey_FFs574.png表1:用mIOU测量的语义分割一致性(越高越好)

三、匿名化的内容一致性

为了评估匿名化图像与原始图像之间的整体内容一致性,我们使用了Clarifai的独立图像标注模型。“通用图像标注模型能够识别超过11,000种不同的概念,包括对象、主题、情绪等。”这些标签描述了模型从输入图像中推断出的内容。

此外,模型还为每个标签提供了置信度。图4展示了Clarifai公共图像标注模型对原始图像及其DNAT版本预测的前5个概念。

wKgZPGe1MlCAFwi8AAJSxT1uHIg291.png图4:来自clarifai的Reese Witherspoon前5个概念。(左原始图像,右DNAT)

理想情况下,通用图像标注模型应该为原始图像和匿名化图像预测完全相同的概念。为了衡量一致性,我们使用Clarifai为每种匿名化技术的所有测试样本预测概念。然后,我们计算了匿名化图像与原始图像之间前N个预测概念的平均精度(mAP)(其中N代表不同概念的数量)。

通过mAP,我们评估了两点:预测概念的一致性及其相关分数。例如,考虑一个匿名化图像及其原始图像对,经过图像标注模型处理后,如果某个概念在匿名化图像中的置信度值低于其在原始图像中的置信度值,则对最终mAP分数的影响较小;而如果某个概念仅出现在匿名化图像中,而未出现在其原始图像中,则影响较大。

前5和前50个概念的结果如表2所示。

wKgZPGe1Ml-AE1fuAAB6YSyVKHE911.png表2:用mAP测量图像概念一致性(越高越好)

四、总结

本文探讨了如何通过深度自然匿名化(DNAT)技术提升匿名化数据的价值,打破了传统匿名化方法在合规性与数据质量之间的固有权衡。DNAT通过生成自然替换而非破坏像素信息,不仅有效保护了个人隐私,还最大限度地保留了数据的分析价值。

实验表明,DNAT在图像分割内容一致性方面显著优于传统匿名化方法,能够更好地支持后续的AI分析和应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 汽车电子
    +关注

    关注

    3043

    文章

    8558

    浏览量

    172227
  • 图像处理
    +关注

    关注

    28

    文章

    1340

    浏览量

    59176
  • 图像识别
    +关注

    关注

    9

    文章

    529

    浏览量

    39837
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261490
  • 数据处理
    +关注

    关注

    0

    文章

    642

    浏览量

    29806
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深度解析:双模态仿真测试解决方案!

    随着端到端自动驾驶架构的兴起,传统基于规则的仿真测试正面临“真实感不足”与“场景泛难”的双重挑战。本文深入解析推出的双模态仿真测试解决方案:一方面依托aiSim提供确定性的物理级
    的头像 发表于 11-21 17:32 8544次阅读
    深度解析:<b class='flag-5'>康</b><b class='flag-5'>谋</b>双模态仿真测试解决方案!

    自动驾驶数据采集时间同步指南:方法、挑战、场景与解决方案

    自动驾驶数据采集面临多传感器协同与多总线协议割裂的挑战,时间同步精度直接影响系统安全与研发效率。科技推出"全以太网+gPTP"方案,通过硬件级时间戳、多协议转以太网聚合等技术
    的头像 发表于 11-21 16:48 1786次阅读

    L4级自动驾驶数据采集系统首选——科技DATALynx ATX4 &amp; BRICK系列全解析

    ,并具备智能数据筛选和OTA升级功能。已成功应用于Robotaxi数据闭环和智驾验证平台,显著提升数据处理效率。科技凭借全栈工具链和全球
    的头像 发表于 11-20 16:16 851次阅读

    新闻 | 实力认证!aiSim荣获ASAM“自动驾驶仿真技术奖”

    、零部件供应商、科技公司及行业专家,共探先进数据与仿真技术融合、ASAM国际标准应用等核心热点。受邀参会并深度参与交流,凭借
    的头像 发表于 11-11 17:33 1924次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>新闻 | 实力认证!<b class='flag-5'>康</b><b class='flag-5'>谋</b>aiSim荣获ASAM“自动驾驶仿真<b class='flag-5'>技术</b>奖”

    aiSim 携经纬恒润焕新 HIL 测试,诚邀集成商共建生态!

    在智能驾驶从“模块”迈向“端到端”的技术浪潮中,高保真、全链路的仿真测试已成为行业刚需。科技推出的aiSim端到端智驾仿真软件,与经纬恒润强强联合,共同打造了智能驾驶HIL仿真测
    的头像 发表于 10-28 17:32 235次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b> aiSim 携经纬恒润焕新 HIL 测试,诚邀集成商共建生态!

    新闻 | 与Robotec.ai正式建立合作伙伴关系!

    我们很高兴地宣布:与Robotec.ai正式建立合作伙伴关系,负责该品牌及产品在中国地区的销售和售后服务,此次合作旨在通过整合双方的技术专长和市场资源,共同推动机器人和自动驾驶领域的技术
    的头像 发表于 09-08 17:44 2959次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>新闻 | <b class='flag-5'>康</b><b class='flag-5'>谋</b>与Robotec.ai正式建立合作伙伴关系!

    新闻 | 加入ASAM组织,全球首个ASIL-D认证自动驾驶仿真平台aiSim引领安全新标杆

    !ASAM作为国际汽车行业标准领域的权威机构,致力于推动仿真、测试及数据交互的标准进程。此次加入,标志着在自动驾驶仿真
    的头像 发表于 08-29 16:57 843次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>新闻 | <b class='flag-5'>康</b><b class='flag-5'>谋</b>加入ASAM组织,全球首个ASIL-D认证自动驾驶仿真平台aiSim引领安全新标杆

    突破传统桎梏,PPEC Workbench 开启电源智能设计新路径

    匹配。 PPEC Workbench 电力电子智能设计平台凭借图形算法编程、智能设计、高效协同等核心理念,突破传统电源设计的限制,为
    发表于 08-26 11:40

    加入ASAM组织,自动驾驶仿真平台aiSim引领安全新标杆

    科技正式加入全球汽车标准组织 ASAM(Association for Standardization of Automation and Measuring Systems),成为其正式会员单位!
    的头像 发表于 07-09 16:53 520次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>加入ASAM组织,自动驾驶仿真平台aiSim引领安全新标杆

    FLIR先进技术如何助力安全生产

    夏日炎炎,安全更不能忘!在工业生产中每一个细节都关乎到人员的生命安全和设备的稳定运行,今天就让我们一起了解如何通过FLIR的先进技术为夏季生产保驾护航!
    的头像 发表于 07-07 16:58 800次阅读

    云翎智能全国产执法记录仪核心技术突破:自主可控新标杆

    核心技术维度解析其创新价值:云翎智能纯国产执法记录仪一、纯北斗高精度定位:突破传统盲区,实现厘
    的头像 发表于 05-07 10:05 593次阅读
    云翎智能全国产<b class='flag-5'>化</b>执法记录仪核心<b class='flag-5'>技术</b><b class='flag-5'>突破</b>:自主可控新标杆

    分享 | 3DGS:革新自动驾驶仿真场景重建的关键技术

    3DGS技术为自动驾驶仿真场景重建带来突破,通过3D高斯点精确表达复杂场景的几何和光照特性,显著提升渲染速度与图像质量。aiSim平台结合3DGS,提供高保真虚拟环境与动态交通流模
    的头像 发表于 03-05 09:45 4772次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>分享 | 3DGS:革新自动驾驶仿真场景重建的关键<b class='flag-5'>技术</b>

    方案 | 本地匿名化解决方案:隐私保护、自主掌控和高效运行!

    本地匿名化解决方案,以隐私和安全为核心设计原则,利用Terraform部署技术实现灵活自动扩展,确保高吞吐量与高效管理。该方案确保隐私保护、具备高灵活性与控制力,并支持离线操作,已广泛应用于欧洲多个行业领导者,为企业数据管理、安
    的头像 发表于 01-22 11:15 3807次阅读
    <b class='flag-5'>康</b><b class='flag-5'>谋</b>方案 | 本地<b class='flag-5'>匿名</b>化解决方案:隐私保护、自主掌控和高效运行!

    解锁Chiplet潜力:封装技术是关键

    的关键钥匙。 Chiplet: 超大规模芯片突破的关键策略 面对全球范围内计算需求的爆炸性增长,高性能芯片市场正以前所未有的速度持续扩张。在这一背景下,Chiplet技术以其独到的设计理念与先进的封装工艺,成为了
    的头像 发表于 01-05 10:18 1801次阅读
    <b class='flag-5'>解锁</b>Chiplet潜力:封装<b class='flag-5'>技术</b>是关键

    与Anyverse建立合作伙伴关系

    日前,虹科姐妹公司与Anyverse正式建立合作伙伴关系,负责该品牌及产品在亚太地区的销售和售后服务,此次合作旨在通过整合双方的技术专长和市场资源,共同推动汽车自动驾驶领域的技术
    的头像 发表于 12-16 15:04 954次阅读