0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

探索不为人知的人工智能黑暗面

mK5P_AItists 来源:未知 作者:胡薇 2018-11-05 10:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习是现在大家都打了鸡血想用或者在用的技术。但是,你以为只有好人能用它吗?Too young too simple!

接下来,我将揭秘AI技术黑暗的一面——犯罪份子和人工智能的孽缘。

当计算科学发展的不够完善,还没能解决启发式问题的时候,很多安全问题都是利用规则来解决的,这些规则都是“死”的。

那时候没人觉得计算机能够破解密码、读出来验证码内容或者掌握马路交通的规律。但是现在,人工智能发展极快,老掉牙的基于规则的安全保障系统轻而易举的就被AI秒成渣。

验证码和AI的不解情缘

当我们上网的时候,最烦的就是验证码,它老是来让你填。这是计算机在确定你却是是个“大活人”,而不是一个程序在恶意攻击访问它。

这样做是因为咱们人类用户通过鼠标键盘访问某个网站或资源的这个操作,计算机都能用一段程序来同样做到。

比如说,当你连续三次在登陆Facebook的时候输错密码,网站肯定会跳出来一个验证码来确定你是个活人而不是恶意暴力破解密码的程序(当然了,我会首先想到梯子被踹了)。Facebook还有很多公司的服务器都是这种安全措施,而这种安全措施都是用验证码的,比如常见的验证码长成这样:

多年以来,验证码都能有效的区分恶意攻击代码还有人类用户。但是现在聪明AI时代到来了,验证码在它面前仿佛就是送分题。

CNN(卷积神经网络)就是一个很简单的技术来破解验证码,只要你能给他大量的验证码学习数据集。每张验证码都有一个特定的目标,识别文字或者识别物体之类的。

但是,这些问题在CNN面前都将形同虚设。上述说的只是一个简单的栗子,没太多的技术术语,只要知道简单的神经网络的原理就能看懂。

既然验证码的保护都不起作用了,暴力破解的威胁就更可怕了。你也许会说,我看到过更难的那种验证码,就是从一堆图片里找出个公交车或者找出路牌儿之类的那种(你肯定没少上Youtube!) 。但其实,它们对于AI来说也不难,你肯定听说过谷歌大法的目标检测有多伟大,虽然谷歌仅仅把它作为搜索引擎的一个基础功能来用。

GAN和密码的那些事

注:GAN = Generative Adversarial Networks,读音:干!翻译是对抗生成网络。

咱们的密码一般不会设的特别奇怪,长这样的毕竟是少类: 5f2#V0”P?oz3(几乎就是异类了)。

差不多咱们的密码都长成这样:kronebourg1664,名字加数字大小写什么好记还好输入。

当然了,也有少部分不怕死的这么设密码:password(肯定老被盗)。

对于猜到第一种密码,我天,太难了,不论是对人脑来说还是对一块GTX 1080 GPU来说都太难猜中了(GTX 1080是一块英伟达家的GPU,不只是能用来玩游戏,现在更多人用来跑深度学习工程)。

但是其他的密码嘛,相对来说就容易一些了。所以我们怎么猜这些密码呢?最简单的方法就是翻一本厚厚的字典,然后将每个单词都当成密码去试。这种情况下如果你也就能猜中用“password”当密码的童鞋了。

什么?你真的拿“password”当密码?哥们儿,英语不错呀,你怎么不试试拼音“mima”当密码?赶紧换一个靠谱的吧……

现在,来点高科技的,用AI来猜你的密码。你以为AI还会翻字典?当然不是,神经网络会自己产生一大堆密码候选项。我们就用这堆候选来攻破你的密码。很玄幻?读一读PassGAN这篇文章吧,下面这个图讲了这堆候选项是怎么产生的。

PassGAN:A Deep Learning Approach for Password Guessing的arxiv链接是:

https://arxiv.org/abs/1709.00440

就算你对神经网络很熟,这篇论文可能看起来也不是那么轻松。 这不是简单的通过输入来预测结果,它是先从数据里面学习数据的特点,然后让生成器生成一些具有类似特点的样本出来的特殊网络结构。

专业上叫Generative Adversarial Network(对抗生成网络,一般简写成GAN,提出GAN的就是那个写深度学习花书的大神古德菲洛)。GAN里面包括了两个神经网络,一个生成器和一个检查器。

检查器用于检验输入的数据是否合理,生成器用于来回折腾演化自己让生成的数据能在检查器眼皮子底下蒙混过关。

译者注:这里有个链接,我觉得可以不加,因为就是在一个门户里搜了一下神经网络关键词的结果,毫无营养……然后那个啥,GAN的解释我没用原文,因为太枯燥了怕别人看不懂,我就结合自己的认识写了一个,如果翻译的不好的话再联系我翻译这句。

为了使用PassGAN,我们要有一个不知道哪儿来的真实的密码数据集(也许是某东某讯某度泄漏的?)。从这个数据集里起码能知道人们真正使用的数据集大概长成什么样。一般就是有一些大写字母,一些日期,一些随机的数字,一些名字之类的。

然后呢,我们要用到一个噪声产生器,就是生成一些随机数用的。噪声产生器和密码数据集就是咱们神经网络模型的输入了。

网络的输出就是二分类值,也就是说在有监督训练的时候,网络模型会被告诉说这个密码是真实的还是假的。

在每次神经网络前向传递的时候,网络的输出都会跟真实的标签值进行比较,然后带着这个误差值反向传递回去迭代修改网络的权重。生成器也会跟着模型的训练而成长,因为随着网络模型变化,生成器根据噪声所产生的结果也越接近真实的密码。

当生成器训练完毕之后,之后我们再输入一个噪声,网络就能输出一个特别真实的密码。所以我们只要让PassGAN运行几个小时,就能得到一堆密码候选项了。

AI和网络钓鱼的那些事儿

钓鱼是很常见的黑客技术。你肯定收到过一些看着不太对劲的邮件,自称是银行、移动联通或者微博的人。然后邮件里面还给你一个链接,跳到一个能让你中毒的网页。

想做这样一个钓鱼邮件,你只要照着Facebook或者什么其他大公司的邮件样式外观和语言仿造一封即可。然后又见里面说你的软件得更新,或者点开看看这里有什么惊喜,或者让你填写登陆信息等。

简单粗暴还老套。不论你写了什么,结果都会被发送到不法分子的服务器上。先不说这个,AI是怎么跟钓鱼勾搭上的?

机器学习里面有个利器叫爬虫,它能通过爬取目标网站的各种信息来改进钓鱼技术。通过爬虫保存下来的数据,黑客们能够学习到这些网站的外观,还有文字书写的风格,然后据此产出大量的假邮件然后大规模发送。但是有邮件不知道往哪儿发也是个问题。所以聪明的黑客还能通过前面咱们说的GAN技术来猜测邮件地址,这就增加了让人上当的机会。

有的童鞋可能说了,现在我们用的邮箱里面都有反钓鱼的安全措施~安全的很。但悲剧的是,现在的机器学习已经知道怎么产生能够通过钓鱼检查的钓鱼邮件了!

训练集是这样婶儿的,一大堆邮件,一些邮件是被反钓鱼拦住的,还有一些是能成功发送的。然后我们就能据此训练处一个神经网络模型,来知道钓鱼算法是怎么检测的。在不久的将来,钓鱼邮件也许都是这种反钓鱼巨网下的“漏网之鱼”。

咳咳,总结一下

好消息是,目前只有三种被AI攻克的安全领域。坏消息是,还有巨多的场景正面临着AI黑客的威胁,比如诈骗广告等。但是我相信AI在合法的领域中应用所带来的好处要远大于不法之徒将它们用于作恶上的坏处。

其实,挺讽刺的,现在有很多将人工智能用于侦破犯罪活动的案例,从街头的巡查到网络诈骗都有所设计。最后总结一下:

1.如果你觉的自己的密码能让GAN给猜到的话,赶紧换个密码吧,比如wenzhaizhenshuai就很不错(因为没人觉得文摘菌帅,所以GAN学不到这个信息)。

2.别点开不知道谁发给你的链接,除非你十分确定发邮件的人没问题;

3.千万别用AI做恶呀!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261508
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233

原文标题:人工智能黑暗面

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    声荣获2025人工智能治理示范案例

    服务业协会联合组织征集的《北京人工智能治理案例集》在会议期间正式发布。云声"基于医疗大模型和医学知识图谱技术打造可信可靠的医学AI应用"凭借其创新的技术架构和卓越的治理实践,荣获"人工智能治理示范案例"。
    的头像 发表于 11-10 17:28 810次阅读

    CGTN America与CCTV UN:探索人工智能驱动的叙事未来

    华盛顿2025年8月23日 /美通社/ -- CGTN America和CCTV UN发布《探索人工智能驱动的叙事未来》(Explore the Future of Storytelling
    的头像 发表于 08-25 13:42 214次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,一门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:23

    声梁家恩受聘为广西人工智能战略咨询专家委员会委员

    近日,云声联合创始人&董事长&CTO梁家恩博士正式受聘为广西人工智能战略咨询专家委员会委员。这一荣誉不仅是对他在人工智能领域多年深耕所获成就的认可,更彰显了云声在AI技术创新与产业
    的头像 发表于 07-18 17:27 912次阅读

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    声积极推动厦门人工智能产业发展

    近日,厦门市市长伍斌在市政府会见了云声创始人、CEO黄伟一行。双方就深化合作、共促厦门人工智能产业发展进行交流。
    的头像 发表于 04-22 16:19 583次阅读

    DeepSeek对人工智能领域的启示

    本文作者是 IBM 董事长兼首席执行官 Arvind Krishna。他认为,社会各界不应止步于应用人工智能,更要成为人工智能的共建者。
    的头像 发表于 02-07 09:46 1441次阅读

    人工智能和机器学习以及Edge AI的概念与应用

    作者:DigiKey Editor 人工智能(AI)已经是当前科技业最热门的话题,且其应用涉及人类生活的各个领域,对于各个产业都带来相当重要的影响,且即将改变人类未来发展的方方面面。本文将为您介绍
    的头像 发表于 01-25 17:37 1577次阅读
    <b class='flag-5'>人工智能</b>和机器学习以及Edge AI的概念与应用

    声荣膺2024胡润中国人工智能企业50强

    近日,胡润研究院发布了《2024胡润中国人工智能企业50强》榜单,云声凭借其在人工智能领域的卓越创新和智能体(Agent)商业化能力荣耀上榜。
    的头像 发表于 01-16 10:02 771次阅读

    Embarcadero:人工智能驱动发展我们的期望是什么

    人人都在谈论人工智能。我们的Visual Assist 团队对人工智能有何期望?显然,人工智能与我们息息相关——关于这一点的讨论已经无需多言——但它也被过度炒作了。我们简单客观地了解一下,我们认
    的头像 发表于 01-15 10:46 646次阅读

    声入选2024年度中关村科学城人工智能全景赋能典型案例

    联合体等。云声凭借其在医疗领域的创新应用——“基于大模型和语音交互技术的医疗文书自动生成系统”,成功入选“2024年度中关村科学城人工智能全景赋能典型案例”。
    的头像 发表于 12-24 10:27 891次阅读

    声受邀参加北京人工智能企业座谈会

    日前,南京市市长陈之常带队赴北京拜访有关企业和单位,并主持召开人工智能企业座谈会。此次会议围绕“协同推动AI创新发展,共筑智能未来”主题展开,旨在通过政企间的深度对话,探索人工智能技术
    的头像 发表于 12-24 10:25 687次阅读

    卡诺模型为人工智能领域提供了一种全新的视角

    探索人工智能如何更深层次满足用户需求、提升用户体验的旅程中,卡诺模型(Kano Model)提供了一个极具价值的理论框架。这一模型不仅为产品开发者带来了深刻的洞察力,同时也为人工智能领域的创新提供
    的头像 发表于 12-11 10:17 946次阅读