人工智能：机器学习模型存在着对抗样本的安全威胁-电子发烧友网

导语

近年来，随着人工智能的蓬勃发展，机器学习技术在网络入侵检测领域得到了广泛的应用。然而，机器学习模型存在着对抗样本的安全威胁，导致该类网络入侵检测器在对抗环境中呈现出特定的脆弱性。本文主要概述由对抗样本造成的逃逸攻击，分为上下两篇。上篇从基本概念出发介绍逃逸攻击的工作机理，下篇则介绍一些针对逃逸攻击的防御措施。希望能让读者更清晰的认知基于机器学习的网络入侵检测器所存在的安全风险。

当网络入侵检测器遇到机器学习

网络入侵检测系统（Network Intrusion Detection System，NIDS）通过采集网络流量等信息，发现被监控网络中违背安全策略、危及系统安全的行为，是一种重要的安全防护手段。面对日益复杂的网络环境，传统NIDS所存在的缺点日益突出，例如系统占用资源过多、对未知攻击检测能力差、需要人工干预等。在此背景下，研究人员迫切地探寻新的解决方案，并将目光投向了发展迅速的机器学习技术。基于机器学习的网络入侵检测器是将网络入侵检测的问题建模成一个针对网络流量的分类问题，从而使用一些机器学习的方法精练出分类模型进行分类预测。目前，多种机器学习算法，例如决策树、支持向量机、深度神经网络等，被用于区分入侵流量和良性流量，并取得了良好的实验结果。

什么是对抗样本

2013年，Szegedy等人首次在深度神经网络（Deep Neural Network，DNN）中发现了对抗样本，并引起了机器学习社区的广泛讨论。对抗样本是指通过对原始的输入样本添加轻微的扰动所产生的输入样本，该样本与原始样本相近，却能够在不改变机器学习分类模型的情况下，导致目标模型输出错误的分类结果。事实上，从传统的机器学习模型到深度学习模型，再到强化学习模型，都存在对抗样本的问题。鉴于目前机器学习技术已渗透到图像识别、自然语言处理、恶意软件检测等多个领域，对抗样本的发现为狂热的机器学习应用浪潮带来了一定的冲击。

逃逸攻击

针对基于机器学习的NIDS，攻击者可利用对抗样本来逃逸NIDS对入侵流量的检测，这种攻击被称为逃逸攻击（或对抗样本攻击、对抗攻击等）。图1展示了一种经典的逃逸攻击流程。NIDS部署在被保护网络的边界，通过提取数据包或网络流的特征形成输入样本，然后利用机器学习分类模型来识别该样本是否属于入侵流量。在发动逃逸攻击时，攻击者首先捕获入侵流量所形成的输入样本，通过一定的手段来生成对抗样本，然后回放依据对抗样本产生的入侵流量。由于机器学习分类模型的脆弱性，该流量被NIDS错误分类成良性流量，从而到达受害网络。

人工智能：机器学习模型存在着对抗样本的安全威胁

图1 一种逃逸攻击示意图

威胁模型

由攻击者发起的逃逸攻击可以从四个维度来刻画，分别是敌手知识、敌手能力、敌手目标、攻击策略。其中敌手知识是指攻击者掌握目标机器学习模型的背景信息量，包括模型的训练数据、特征集合、模型结构及参数、学习算法及决策函数、目标模型中可用的反馈信息等。根据敌手知识，可将逃逸攻击分为以下两类：

（1）白盒攻击。攻击者在完全了解目标模型的情况下发起攻击。在此情况下，目标模型的网络架构及参数值、为样本提取的特征集合、使用的训练方法等信息都暴露给了攻击者，另外在某些情况下还包括目标模型所使用的训练数据集。

（2）黑盒攻击。发起攻击时，攻击者仅对目标模型具有有限的知识，例如攻击者可获取模型的输入和输出的格式和数值范围，但是不知道机器学习模型的网络架构、训练参数和训练算法等。在此情况下，攻击者一般通过传入输入数据来观察输出、判断输出与目标模型进行交互。

对逃逸攻击而言，攻击者可不具备操纵目标模型、操纵目标模型的训练数据的能力。但是敌手能力必须包括可操纵目标模型的测试数据，即攻击者能够对用于测试模型的网络流量进行修改，这种修改可以在网络流（Flow）层进行也可以在数据包（Packet）层。对于逃逸攻击，敌手目的是影响目标机器学习模型的完整性（Integrity）。具体地讲，逃逸攻击的敌手目标包括以下几类：

（1）减小置信度：减小输入分类的置信度，从而引起歧义。

（2）无目标误分类：将输出分类更改为与原始类不同的任何类。

（3）有目标的误分类：强制将输出分类为特定的目标类。

（4）源到目的误分类：强制将特定的输入的输出分类为特定的目标类。

根据敌手知识和敌手目的将逃逸攻击的威胁模型进行整合，结果如图2所示。可以看出，黑盒模式下的有目标攻击将会极大地增加攻击难度。

人工智能：机器学习模型存在着对抗样本的安全威胁

图2 逃逸攻击的威胁模型分类

常见的攻击策略

逃逸攻击的核心在于如何构造能够使机器学习模型产生误分类的对抗样本。针对基于机器学习的网络入侵检测器，目前研究人员已提出多种生成对抗样本的方法，主要包括以下几类：

（1）基于梯度的方法。该类方法仅适用于白盒攻击。在图像识别领域，Goodfellow等人［15］提出了快速梯度符号（FGSM）法，该方法假设攻击者完全了解目标模型，通过在梯度的反方向上添加扰动增大样本与原始样本的决策距离，从而快速生成对抗样本。随后，改进的方法例如PGD、BIM、JSMA等相继被提出。在此基础上，研究工作［1］-［6］都采用了这类方法来对修改网络流层上特征，进而生成针对网络入侵检测器的对抗样本。

（2）基于优化的方法。该类方法即存在于白盒攻击又存在于黑盒攻击。Szegedy等人［16］首次将寻找最小可能的攻击扰动转化为一个优化问题，并提出使用L-BFGS来解决这个分析。这种方法攻击成功率高，但计算成本也高。Carlini等人［17］对其进行了改进，提出了攻击效果更好的目标函数，并通过改变变量解决边界约束问题，被称为C&W攻击。研究工作［4］-［6］都采用了这种方法来生成攻击NIDS的对抗样本。此外，文献［12］［13］研究在黑盒模式下生成对抗样本的问题，同样将其转化为一种优化问题，并分别采用遗传算法和粒子群算法来解决，从而快速搜索出对抗样本。

（3）基于生成对抗网络的方法。该类方法常见于发动黑盒攻击。研究工作［7］-［9］均建立生成对抗网络（Generative Adversarial Network，GAN）来生成对抗样本。一般地，目标NIDS作为GAN的检测器，GAN的生成器则用于产生对抗扰动，并且GAN检测器对输入样本的预测得分将用来训练GAN的生成器。特别地，生成网络一旦训练完毕，就可以有效地为任何样本生成扰动而不需要向目标NIDS发送任何问询。

（3）基于决策的方法。该类方法适用于在黑盒模式下发动攻击。在真实的逃逸攻击中，攻击者很少能够获取目标模型的预测值，针对目标模型仅给出类别标签的情况，Peng等人［14］提出了改进的边界攻击方法来生成DDoS攻击的对抗样本。该方法的主要思想是通过迭代地修改输入样本来逼近目标模型的决策边界。此外，研究工作［10］同样采用基于决策的思想，借助有限的目标NIDS的反馈，不断的在数据包层次上或网络流层次上修改NIDS的原始输入样本，从而生成逃逸的变异样本。与其它方法相比，该类方法需要的模型信息更少、实用性更高，但是需要向目标NIDS发送大量的问询，需要更高的攻击代价。

小结：

机器学习为网络入侵检测提供了新的解决思路，同时也带来了新的安全隐患。在机器学习成为网络安全利器的道路上，攻击与防御之间博弈不断升级，“机器学习+网络安全”的研究依然任重道远。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1776

文章
43871

浏览量
230625
网络攻击

网络攻击

+关注

关注
0

文章
325

浏览量
23280
机器学习

机器学习

+关注

关注
66

文章
8126

浏览量
130571

5G智能物联网课程之Aidlux下人工智能开发

/27184.html *附件：初学者完整学习流程实现手写数字识别案例.pdf 人工智能 语音对话机器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件：语音对话

发表于 04-01 10:40

嵌入式人工智能的就业方向有哪些?

联网ARM开发 NB-IoT开发及实战七：python工程师，人工智能工程师 python语法基础 python核心编程基于OpenCV的机器视觉开发嵌入式人工智能渗入生活的方方面面，广泛应用

发表于 02-26 10:17

人工智能大模型、应用场景、应用部署教程超详细资料

人工智能是IC行业近几年的热词，目前此技术已经有很多成熟的模型和落地案例。在此跟大家做个分享，更多详细资料，请自行搜索：【展锐坦克邦】，坦克邦-智算天地集算法模型、部署说明于一体，为广大客户提供了

发表于 11-13 14:49

ai人工智能机器人

随着时间的推移，人工智能的发展越来越成熟，智能时代也离人们越来越近，近几年人工智能越来越火爆，人工智能的应用已经开始渗透到各行各业，与生活交融，成为人们无法拒绝，无法失去的一个重要

发表于 09-21 11:09

《通用人工智能：初心与未来》-试读报告

、社交、想象力、创造力、感知力，这是无法用逻辑和推理去定义和构造的。人工智能路途遥远，远远还不到与人类竞争的程度，而且也不会反生的。与其胡思乱想，不如好好学习发展人工智能，让社会的生产力继续提高，让

发表于 09-18 10:02

面向OpenHarmony终端的密码安全关键技术

要求高，需要保证OpenHarmony终端应用在联网的过程中不受传统网络威胁影响。 人工智能模型在OpenHarmony终端中大量运用，而自身的黑盒特性使其安全与测试问题引起了国际社会

发表于 09-13 19:20

如何将人工智能应用到效能评估系统软件中去解决

以使用机器学习算法，对实时数据进行分析和处理，以便更好地总结和预测未来趋势。　　其次，华盛恒辉人工智能可以帮助我们识别业务流程中的瓶颈和短板，并提供更有效的解决方案。例如，我们可以使用智能

发表于 08-30 12:58

人工智能和机器学习的区别有哪些

人工智能和机器学习通常可以互换着使用，但是人工智能更加宽泛，人工智能由更多的技术所组成，机器

发表于 08-25 08:23 •1377次阅读

人工智能需要学习什么

和层次，分析人工智能需要学习的内容。 1. 数据学习 人工智能最根本的就是数据，只有通过数据的学习和处理，才能让

发表于 08-12 17:12 •640次阅读

怎么学习人工智能

怎么学习人工智能 人工智能是当今最热门的领域之一，因其在工业、商业、医疗和其他行业中的应用而广受欢迎。学习人工智能可以带来许多好处，例如深入

发表于 08-12 16:43 •735次阅读

人工智能课程有哪些

，以帮助您选择合适的课程。 1. 机器学习机器学习是人工智能领域中最常见的技术，也是许多其他人工智能

发表于 08-12 16:40 •824次阅读

人工智能学习什么

人工智能学习什么 人工智能学习什么？ 人工智能（Artificial Intelligence，简称 AI）是一门综合性的学科，它属于计算机

发表于 08-12 16:36 •973次阅读

AI 人工智能的未来在哪？

人工智能、AI智能大模型已经孵化；繁衍过程将突飞猛进，ChatGPT已经上线。世界首富马斯克认为AI对人类是一种威胁；谷歌前CEO施密特认为AI和

发表于 06-27 10:48

【书籍评测活动NO.16】通用人工智能：初心与未来

之后的达特茅斯研讨会开始，用机器来模仿人类学习及其他方面的智能，即实现“人工智能”（Artificial Intelligence，AI）便成为计算机领域持续的研究热点。时至今日，以深

发表于 06-21 14:41

人工智能、算法与机器学习辨析

人工智能 (AI)、机器学习 (ML) 和算法这几个词经常出现误用、混淆和误解。尽管它们都有各自的固定含义，但是人们常常会将这几个概念互换使用。遗憾的是，如果没有领会这些含义，它们可能会让本已

发表于 05-09 10:55 •1522次阅读

搜索历史

人工智能：机器学习模型存在着对抗样本的安全威胁

评论

5G智能物联网课程之Aidlux下人工智能开发

嵌入式人工智能的就业方向有哪些?

人工智能大模型、应用场景、应用部署教程超详细资料

ai人工智能机器人

《通用人工智能：初心与未来》-试读报告

面向OpenHarmony终端的密码安全关键技术

如何将人工智能应用到效能评估系统软件中去解决

人工智能和机器学习的区别有哪些

人工智能需要学习什么

怎么学习人工智能

人工智能课程有哪些

人工智能学习什么

AI 人工智能的未来在哪？

【书籍评测活动NO.16】通用人工智能：初心与未来

人工智能、算法与机器学习辨析