0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何为深度学习模型设计审计方案

星星科技指导员 来源:NVIDIA 作者:NVIDIA 2022-04-19 14:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当您购买最后一辆车时,您是否检查了制造商的安全等级或质量保证。也许,像大多数消费者一样,你只是去试驾看看这辆车是否提供了你想要的所有特性和功能,从舒适的座椅到电子控制。

审计和质量保证是许多行业的规范。考虑汽车制造业,在汽车生产之前,在安全性、舒适性、网络化等方面进行严格的测试,然后再将其部署到最终用户。基于此,我们提出了一个问题:“我们如何为深度学习模型设计一个类似动机的审计方案?”

人工智能在现实世界的应用中获得了广泛的成功。当前的人工智能模型尤其是深度神经网络,不需要对所需行为类型的精确说明。相反,它们需要大量的数据集用于培训,或者需要设计一个必须随时间优化的奖励函数。

虽然这种形式的隐式监督提供了灵活性,但它通常会导致算法针对人类设计者不希望的行为进行优化。在许多情况下,它还会导致灾难性后果和安全关键应用程序的故障,如自动驾驶和医疗保健。

由于这些模型很容易失败,特别是在域转移的情况下,因此在部署之前知道它们 MIG ht 失败的时间非常重要。随着深度学习研究越来越与现实世界的应用相结合,我们必须提出正式审核深度学习模型的方案。

语义一致的单元测试

审计中最大的挑战之一是理解如何获得对最终用户直接有用的人类可解释规范。我们通过一系列语义一致的单元测试解决了这个问题。每个单元测试验证输入空间中受控和语义对齐的变化(例如,在人脸识别中,相对于相机的角度)是否满足预定义规范(例如,精度超过 95% )。

我们通过直接验证生成模型的可解释潜在空间中的语义对齐变化来执行这些单元测试。我们的框架 AuditAI 弥补了软件系统可解释形式验证和深度神经网络可伸缩性之间的差距。

poYBAGJeW7qANnIvAAIkWVLAtyc083.png

图 1 。 AI 从项目到部署的一般机器学习过程。

考虑一个典型的机器学习生产流水线三方:部署模型的最终用户、验证者和模型设计器。验证器在验证设计者的模型是否满足最终用户的需求方面起着关键作用。例如,单元测试 1 可以验证当人脸角度在d度范围内时,给定的人脸分类模型是否保持 95% 以上的准确性。单元测试 2 可以检查模型在何种照明条件下的准确度超过 86% 。验证之后,最终用户可以使用验证过的规范来确定在部署期间是否使用经过培训的 DL 模型。

poYBAGJeW7uABoGRAAIk_OkoKyU044.png

图 2 。 Deep networks 接受认证培训,以确保可能满足单元测试。

经验证的部署

为了验证深层网络的语义一致性,我们使用生成模型将其连接起来,这样它们共享相同的潜在空间和将输入投射到潜在代码的相同编码器。除了验证单元测试是否满足要求外,我们还可以执行认证培训,以确保单元测试可能首先满足要求。该框架具有吸引人的理论性质,我们在本文中展示了如何保证验证者能够生成验证是真是假的证明。有关更多信息,请参阅语义规范[LINK]下的审核 AI 模型以验证部署。

与 AuditAI 相比,基于像素的扰动的神经网络验证和认证训练涵盖的潜在空间语义变化范围要小得多。为了进行定量比较,对于相同的验证误差,我们将像素绑定到潜在空间,并将其与 AuditAI 的潜在空间绑定进行比较。我们表明,在相同的验证误差下, AuditAI 可以容忍比基于像素的对应项(通过 L2 范数测量)大 20% 左右的潜在变化。对于实现和实验,我们使用 NVIDIA V100 GPU s 和 Python 以及 PyTorch 库。

我们展示了与潜在空间中受控变化相对应的生成输出的定性结果。顶行显示 AuditAI 的可视化,底行显示 ImageNet 上 hen 类图像、肺炎胸部 X 射线图像和不同微笑程度的人脸的像素扰动可视化。从可视化中可以明显看出,更广泛的潜在变化对应于生成的输出中更广泛的语义变化。

今后的工作

在本文中,我们开发了一个深度学习( DL )模型审计框架。越来越多的人开始关注 DL 模型中的固有偏见,这些模型部署在广泛的环境中,并且有多篇关于部署前审核 DL 模型的必要性的新闻文章。我们的框架将这个审计问题形式化,我们认为这是在部署期间提高 DL 模型的安全性和道德使用的一个步骤。

AuditAI 的局限性之一是其可解释性受到内置生成模型的限制。虽然在生成模型方面已经取得了令人振奋的进展,但我们认为,在培训和部署过程中,整合领域专业知识以减少潜在的数据集偏差和人为错误非常重要。

目前, AuditAI 没有将人类领域专家直接集成到审计管道中。它间接地使用领域专业知识来管理用于创建生成模型的数据集。纳入前者将是今后工作的一个重要

关于作者

Homanga Bharadhwaj 是卡内基梅隆大学计算机科学学院机器人研究所的博士生。他以前是多伦多大学和向量研究所的 MSC 学生,也是 IIT 坎普尔的一名本科生。这篇文章所涉及的工作是在 Homanga 在 NVIDIA 实习研究期间完成的。

Animesh Garg 是多伦多大学计算机科学助理教授 CVK3 NVIDIA 的资深研究科学家,也是向量研究所的一名教员。他在加州大学伯克利分校获得博士学位,是斯坦福人工智能实验室的博士后。他致力于广义自治的算法基础,使基于人工智能的机器人能够与人类一起工作。他的工作在机器人学和机器学习领域获得了多项研究奖。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5496

    浏览量

    109119
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123923
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    、GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻OCR模型,适合嵌入式设备集成 无监督学习:无
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战可(11大系列课程,共5000+分钟)

    学习模型DLL 硬件联动:支持工业相机硬触发、GPU加速训练(可选) 双轨教学:传统视觉算法+深度学习方案全覆盖 轻量化部署:8.6M超轻O
    发表于 12-03 13:50

    中软国际审计模型创新驱动智领未来

    此前,9月18日-20日,以“跃升行业智能化”为主题的华为全联接大会2025在上海隆重举行。在大会开放演讲环节,中软国际华为技术与解决方案集团审计解决方案经理于勖之发表了题为《审计
    的头像 发表于 09-28 12:35 851次阅读

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被
    的头像 发表于 08-13 09:15 3932次阅读
    自动驾驶中Transformer大<b class='flag-5'>模型</b>会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习模型在各个领域得到了广泛应用。然而,大模型的推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大
    发表于 07-03 19:43

    龙芯中科与文心系列模型开展深度技术合作

    ”解决方案。 强强联合!自主架构赋能大模型训练 文心大模型 文心4.5系列模型均使用飞桨深度学习
    的头像 发表于 07-02 16:53 1149次阅读

    模型时代的深度学习框架

    作者:算力魔方创始人/英特尔创新大使刘力 在 CNN时代 ,AI模型的参数规模都在百万级别,仅需在单张消费类显卡上即可完成训练。例如,以业界知名的CNN模型: ResNet50 为例,模型参数
    的头像 发表于 04-25 11:43 670次阅读
    大<b class='flag-5'>模型</b>时代的<b class='flag-5'>深度</b><b class='flag-5'>学习</b>框架

    用树莓派搞深度学习?TensorFlow启动!

    介绍本页面将指导您在搭载64位Bullseye操作系统的RaspberryPi4上安装TensorFlow。TensorFlow是一个专为深度学习开发的大型软件库,它消耗大量资源。您可以在
    的头像 发表于 03-25 09:33 978次阅读
    用树莓派搞<b class='flag-5'>深度</b><b class='flag-5'>学习</b>?TensorFlow启动!

    在OpenVINO™工具套件的深度学习工作台中无法导出INT8模型怎么解决?

    无法在 OpenVINO™ 工具套件的深度学习 (DL) 工作台中导出 INT8 模型
    发表于 03-06 07:54

    中软国际审计智能体平台接入DeepSeek满血版大模型

    近期,DeepSeek大模型凭借卓越的技术性能和广泛的应用场景迅速成为行业焦点,推动AI技术向纵深发展。中软国际审计团队基于科创中心的算力基础设施和私有化全参满血DeepSeek(含V3/R1 671B双引擎),打造审计垂直领域
    的头像 发表于 02-24 15:42 1605次阅读

    广和通正式推出AI玩具大模型解决方案

    广和通近期推出了一款创新的AI玩具大模型解决方案,该方案深度融合了豆包等AI大模型,并内置了广和通Cat.1模组,为智能玩具的AI化升级提供
    的头像 发表于 01-24 10:36 1759次阅读

    广和通发布AI玩具大模型解决方案

    近日,广和通推出了一项专为AI玩具设计的创新解决方案——AI玩具大模型解决方案。该方案深度融合了豆包等领先的AI大
    的头像 发表于 01-21 14:45 1592次阅读

    广和通推出AI玩具大模型解决方案

    广和通推出AI玩具大模型解决方案,该方案深度融合豆包等AI大模型、内置广和通Cat.1模组,助力智能玩具实现AI化升级。该解决
    的头像 发表于 01-21 10:27 1691次阅读

    【「基于大模型的RAG应用开发与优化」阅读体验】+大模型微调技术解读

    今天学习<基于大模型的RAG应用开发与优化>这本书。大模型微调是深度学习领域中的一项关键技术,它指的是在已经预训练好的大型
    发表于 01-14 16:51

    Flexus X 实例 ultralytics 模型 yolov10 深度学习 AI 部署与应用

    前言: ���深度学习新纪元,828 B2B 企业节 Flexus X 实例特惠!想要高效训练 YOLOv10 模型,实现精准图像识别?Flexus X 以卓越算力,助您轻松驾驭大规模数据集,加速
    的头像 发表于 12-24 12:24 1317次阅读
    Flexus X 实例 ultralytics <b class='flag-5'>模型</b> yolov10 <b class='flag-5'>深度</b><b class='flag-5'>学习</b> AI 部署与应用