0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首席科学家施亮主题为《深度画像的反欺诈应用》的精彩演讲

MqC7_CAAI_1981 来源:lq 2018-12-13 16:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由中国人工智能学会主办,广州易间网络科技有限公司承办的2018第八届中国智能产业高峰论坛11 月17-18日在成都完美收官,论坛在两天的会议里带来了多场精彩报告。

此次小编为大家整理的是来自北京顶象技术有限公司合伙人、首席科学家施亮主题为《深度画像的反欺诈应用》的精彩演讲。

施亮

北京顶象技术有限公司合伙人、首席科学家

以下内容根据速记进行整理

经过施亮本人校对

李康老师的演讲主要是针对人工智能使用框架本身的攻击,就是对人工智能自身的一个攻击。我在很多场合也听过李老师的演讲,但是今天听了之后心里还是有点发毛,其实我们是运用人工智能的技术来对抗黑产,如果碰到李老师这种针对AI工具自身的攻击,我觉得这样的攻击还是特别难防的。今天给大家带来的分享是想讲一下我们怎么使用人工智能技术去应对金融方面的欺诈场景。

首先介绍传统的用户画像技术,包括欺诈用户和正常用户的特征、画像的区别,以及如何通过机器学习的技术来分辨。传统的机器学习技术在这个领域应用也比较广泛,但是它存在一些缺点。第二个部分介绍关联网络图算法。第三部分是由于2017年到今年年初有一个深度学习运用于图算法的爆发期,所以给大家介绍一下深度学习图算法的技术,我们叫做深度画像。最后举几个实际工作中碰到的案例。

1. 传统的用户画像技术

传统的用户画像技术目前被广泛应用于金融领域。如图所示,左面主要是对用户的特征和属性的描述,例如收入、年龄、家庭的情况,这是简单的属性标签。右边是用户的行为,可以通过他的信用报告、贷款和还款的报告,以及转帐交易的行为,通过这些我们可以构造出用户的行为画像。

结合用户属性标签和行为画像,这就是传统画像主要基于的数据点,它是有些优势的。这种数据容易制定一些策略,从业务的角度理解出发,容易制定一些规则,也比较清晰。但是它有一个弱点,就是泛化能力比较弱。采用了一些机器学习的算法后,泛化能力得到了一定程度的加强。但是它没有考虑到用户之间的关系。传统的画像是在考虑用户单点的行为,在真正的行业中发现,用户之间会存在交互和关联关系。

2. 关联网络图算法

关联网络的传统算法分析用户之间的关联,比较早的尝试是对网络结构做一些分析,这种方法最早几十年前就有了,对图的分析,我给大家展示了两张图(见图1),最上面两张图中是对网络结构的展示,通过分析网络里是不是有特殊的结构等,这是比较早期的统计分析。在10年前此研究领域进入到半监督和无监督学习,当时这个研究方向是比较火爆的。中间两张图左图是半监督学习的一个例子。所谓半监督就是我们没有知道全部的样本,通过部分的样本学习出模型。这个图中开始只知道两个点,一个红色、一个蓝色,通过一些方法把信息根据图的结构向其他点进行传递,最后在这个图上可以对其他点也进行分类,这是一个半监督学习的典型例子。中间两张图右图是社区发现的一个例子,通过一些半监督学习最后可以做成这样一个个社区。

大约在5年前开始流行图嵌入学习的研究。图嵌入表示,一般流行的做法是把图中的点用向量进行表征,而且这个转换要符合和保留图的连接特征。在图上相临近的点,经过向量转化后,在向量的空间也是接近的,它们之间也有一定关系。经过向量的表征后可以做大量的算法,比如边的预测(link prediction),或者是分类、聚类的算法。在最下面这个图例中,我们用了一个图像的表征,是二维图像的表征,做了一个可视化的展示。可以看到图中接近的这些点,它们在二维空间中也是比较接近的。

图1

在机器学习算法进入深度学习的时代,用户有两个关切,一个是现在的关联网络也好,或者是关联网络支撑的反欺诈也好,是不是也能够沿用深度学习的技术,包括交互式、可视化的展示。前面李老师也讲了一些例子,我刚才讲传统画像技术里的特征是非常敏感的,如果想跨企业使用这些模型,会受到很大限制,因为你的模型特征是基于用户的很明显特征,比如收入状况、年龄状况等,对于企业之间的隔离,像做迁移学习都会受很大限制。基于这些限制,我们考虑引入深度学习技术。前面的例子是基于比较浅层神经网络的技术。图2列出的是目前比较流行的一些技术。现在的方法出得比较多,特别是像NIPS、AAAI上这类的文章比较多。最上面的图是根据它的拓扑关系和节点,用一个神经网络对每层进行表征,这是比较早的方法。中间的图,这个点其实是去看它的一度的邻居和两度的邻居,把一度的邻居和两度的邻居用深度学习核函数来表征,然后再做叠加。最下面这个图事一种叫GCN的算法,这是最近效果比较好的一个网络;也就是对每个点,通过一定方法,在每个点都用神经网络去模拟,然后在每层叠加形成一个深度网络。这个网络的好处就是它不仅对网络的连接关系进行embedding,也同时对节点的属性进行了embedding,这样出来的embedding结果会更加精确。

所有的建模都是要有数据支撑的,我们做这个项目也不能做无米之炊,首要的问题是构建一个靠谱的网络,图3是我们的一个辅助技术。比如这个网络是通过一个同设备,我们叫做同设备指纹来界定,黑产对抗时,会对手机的APP进行攻击,会模拟这个APP产生一些数据,那么我们采集的APP数据就不靠谱,这时采用什么样的机器学习方法都没有用。传统对APP的保护,可以说是加固或者是代码的混淆,比较容易破解,破解快可能就是1小时。我们做了一个虚拟源码保护的技术,在一个虚拟层做的技术,其被破解的难度比较大,可以做到一机一密,而且在非常短的时间内做到密钥更换。

图3

这个端数据保护技术是支撑上面这一块网络构建(见图3),我们想要的是真实手机数据,这方面我们也在跟国内顶尖的厂商进行合作。因为手机上的内容比大家想象的要多得多,除了屏幕分辨率、CPU型号、APP的版本、操作系统等之外,还有一些其他东西。现在手机基本有陀螺仪、GPS,可能还有一些海拔压力计等,这些信息采集后我们首先会做同人的检测,包括中间会有一些力度、仰角、左右手、操作间隔等,目的是什么?就是判断你的手机是不是被篡改了,或者是不是模拟设备而不是真人在使用。另外一个点就是来看设备和设备之间的关系,也许从表面上看这两个设备不一样,其实我们通过模型来分析有可能是同一个模拟器产生的;或者是有一个网络在中间,可以进行网络连接的。图3是我们用的一些具体技术。

3. 案例

首先是传统风控的场景,这个案例是一个比较传统的一家银行信用卡收单的场景(见图4),这边是信用卡交易的整个流程,一个复杂的系统一定容易受到攻击。这个交易过程是非常复杂的,一张信用卡收单过程涉及5个单位——持卡人、发卡行、收单行、商户和清算中心,任何一个环节通讯的不协调,或者中间的一个漏洞都会给黑产造成可乘之机。比如一张卡,由读卡器一刷,然后做一个伪卡,这是卡的风险。清算中心,这里也是有风险,比如内部的内盗,或者是清算上的数据泄露风险。在商户和收单行之间,黑产也会做一些攻击,中间黑客可能利用时间差搞一些花样,在这当中,包括持卡消费的过程有很多攻击点,我大概列了一下,包括伪卡欺诈等进行的违法犯罪。

图4

下面给大家介绍一个传统的风控方案。首先在这个端上要防止猫池。猫池是黑产模拟手机端的一个设备,其有一个很大的面板上插着成百上千的手机卡,黑产攻击时我们要采用端防护的方法,这里涉及到一个安全SDK的防护和设备指纹的采集。数据服务,信息核验,黑白名单,你的设备IP是不是在黑名单,然后传统的画像策略、风险的评分等。设备指纹黑名单,这是数据上的黑白名单,大家可以简单理解成名单的服务。下一步就是风控策略,主要是一些规则,比如是不是违反了反洗钱的策略,是通过传统的统计学习来作出策略,在当前绝大部分的银行还是一个非常主流的策略。另外,一些大行以及互联网的银行已经开始运用机器学习的方法,比如评分卡的模型、反欺诈的分类模型等,它会做传统的数据处理、特征工程,然后做分类、异常检测、进行评估监控这样整个的过程。

在上面案例中,我们最后是用了一个机器学习的模型——GBDT的模型,效果也不错。它和前面所有的这些,我们叫做全链路的风控。机器学习是不可以单独做风控,这个机器学习是依赖风控链路来做的模型。

这里列举了案例中的优点,可以做实时防护。如GBDT模型上线之后速度比较快;另外在每一个风险点上也可以做及时调整,模型重新的训练也是可以的,根据不同的突发风险来做调整。其缺点,没有考虑到样本之间的关系,忽视了挖掘团伙风险。从欺诈本质来说,欺诈行为很难从一个点完成,因为获利有限,所以基本都是团伙来完成,这个模型没有考虑团伙作案。

下面介绍运用关联网络技术的交易反欺诈和反洗钱,这也是我们在一家银行里做的,图5所示的几个网络中,红色的点是用户,是两个蓝色和黄色网络的主要节点,黄色的点是手机号的节点,绿色所示的是设备指纹网络,通过技术就可以对欺诈和洗钱的网络模式进行挖掘。

图5

图6(a)~(c)是根据传统的图算法挖掘出来的图结果。图(a)是一个疑似洗钱的网络,两个黑色的点表示他们之间有大量的交易,或者是有大量的转帐。这个行有几千万的交易,从这张图中能够看出来,挖掘出可疑的子网——一个洗钱的网络。图(b)同样也是,只是形式不一样。图(c)是根据手机网络挖掘出来的异常,中间是一个手机号;这几个是设备指纹,一个手机号应该是对应一个指纹,我们发现不同的设备指纹对应了同一个手机号,说明它是有问题的。图(d)是我们应用了深度学习技术,银行给到我们的样本,红色的是我们认为有问题的部分,绿色觉得应该是正常的样本。通过图(d)可以看出,中间这部分黑产或者是欺诈的团伙他们的聚集性是很强的,中间还有一些空泡,很异常的点;正常用户其实是不会和他们太近,所以形成了这些空泡。

图6

第二个案例(见图7),它对应的是用户IP和设备的图,正常应该是一条直线,这部分和直线有很大的偏离,通过检测之后发现基本都是异常用户。下面的两个图是我们在做验证码攻防时的图,左边是个热力图,显示某种行为的出现频次;右边图红色的是已知好的样本,蓝色是未知的样本。可以看出,好的样本在中心都是比较有聚集性的;蓝色的散落在周边的,经过验证,基本都是异常或者恶意的访问行为。

图7

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236
  • 深度学习
    +关注

    关注

    73

    文章

    5591

    浏览量

    123914

原文标题:CIIS2018 演讲实录丨施亮:深度画像的反欺诈应用

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    中兴通讯崔丽受邀出席2025腾冲科学家论坛

    近日,“2025腾冲科学家论坛”在云南启幕。本届论坛以“科学·AI改变世界”为主题,汇聚包括诺贝尔奖、图灵奖、菲尔兹奖得主在内的国际顶尖科学家,以及百余位两院院士、高校校长、科技精英与
    的头像 发表于 12-09 11:36 211次阅读

    华为马亮出席第十届5G核心网峰会并发表主题演讲

    11月26日,由Informa Tech主办的第十届5G核心网峰会上,华为云核心网产品线首席营销官马发表题为“5G-A核心网,抓住新的业务变现入口机会”的主题
    的头像 发表于 12-08 14:10 294次阅读

    科学家利用微波激光照射钻石,制造出时间准晶体

    科学家利用微波激光照射钻石,制造出时间准晶体。 美国华盛顿大学、麻省理工学院和哈佛大学科学家携手,成功在钻石上“雕刻”出一种全新的物质形态:时间准晶体。这项突破有望为量子计算、精确计时等领域带来
    的头像 发表于 11-19 07:35 55次阅读
    <b class='flag-5'>科学家</b>利用微波激光照射钻石,制造出时间准晶体

    华为林伟亮相NetworkX 2025并发表主题演讲

    在电信网络盛会 Network X 2025 期间,华为云核心网智能电信云领域总裁林伟发表了题为 《从电信云原生到AI原生:加速电信业务AI创新》 的主题演讲,系统阐述了移动AI时代对电信基础设施提出的新挑战,并分享了华为在关键
    的头像 发表于 10-17 11:45 532次阅读

    国际类脑计算科学家Yulia Sandamirskaya教授加盟时识科技

    近日,国际类脑计算与神经形态机器人领域知名科学家Yulia Sandamirskaya 教授,作为科学家顾问正式加入时识科技(SynSense)。
    的头像 发表于 10-13 13:50 449次阅读

    科技感拉满!鲸启智能机器人与无人机联动,闪耀服务世界青年科学家论坛

    9 月 20 日,以 “青年,世界科学的未来” 为主题的世界青年科学家论坛(南京)在江北新区启幕。20 余位诺贝尔奖得主、海内外院士,超百位国际国内青年科学家及产业代表齐聚,围绕前沿科
    的头像 发表于 10-11 16:54 127次阅读

    喜报|ZYNALOG徴格半导体首席模拟设计科学家乔纳森·史卓德被授予2025年度“钱江友谊使者”称号

    9月28日上午,2025杭州国际人才交流与项目合作大会在杭州国际博览中心隆重开幕。在开幕式上,徴格半导体(杭州)有限公司的首席模拟设计科学家乔纳森·史卓德被授予2025杭州市外国专家"钱江
    的头像 发表于 09-30 14:06 793次阅读
    喜报|ZYNALOG徴格半导体<b class='flag-5'>首席</b>模拟设计<b class='flag-5'>科学家</b>乔纳森·史卓德被授予2025年度“钱江友谊使者”称号

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范式了,与实验
    发表于 09-17 11:45

    CEO主题演讲抢先看!半导体产业万亿市场破局:协作 + AI 成关键,SEMICON West 将深度解析

    文章作者:BobSmith普迪飞首席执行官兼联合创始人、ESD联盟(ESDA)理事会成员JohnKibarian,将在10月的SEMICONWest展会的CEO峰会上发表主题演讲题为
    的头像 发表于 09-08 17:32 1080次阅读
    CEO<b class='flag-5'>主题</b><b class='flag-5'>演讲</b>抢先看!半导体产业万亿市场破局:协作 + AI 成关键,SEMICON West 将<b class='flag-5'>深度</b>解析

    芯盾时代全渠道交易欺诈平台中标安徽省农信社

    芯盾时代中标安徽省农村信用社联合社(简称:安徽省农信社),凭借在金融欺诈领域的深厚积累,以技术实力与标杆案例脱颖而出,为其建设覆盖全业务渠道、全业务场景的企业级欺诈平台,实现事前风
    的头像 发表于 08-14 17:59 1132次阅读

    HDC 2025开发者主题演讲精彩回顾

    日前,华为开发者大会(HDC 2025)进入第二天,行业领袖、技术专家、全球开发者齐聚现场,共同见证这场科技盛会。在开发者主题演讲中,华为技术专家深入解析HarmonyOS的最新技术、体验创新以及
    的头像 发表于 07-09 11:20 1043次阅读

    Nullmax亮相2025上海车展汽车智能化峰会

    日前, 2025上海车展汽车智能化峰会的端到端自动驾驶专题论坛上,Nullmax 首席科学家成二康博士发表《端到端 - One Model Decoder 架构设计》主题演讲,重点讲解
    的头像 发表于 05-06 10:37 1335次阅读
    Nullmax亮相2025上海车展汽车智能化峰会

    商汤绝影王晓刚亮相NVIDIA GTC 2025并发表主题演讲

    商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚在NVIDIA GTC 2025发表演讲《激发通用人工智能的创造力,引领智能汽车走向全新的未来》。
    的头像 发表于 03-21 14:37 971次阅读

    深开鸿亮相“小小科学家”品牌发布暨科学探索研学营开营活动

    为在青少年中营造学科学、爱科学、用科学的浓厚氛围,1月14日,由市委组织部、市委教育工委、团市委共同主办的“小小科学家”品牌发布暨科学探索研
    的头像 发表于 01-15 21:17 835次阅读
    深开鸿亮相“小小<b class='flag-5'>科学家</b>”品牌发布暨<b class='flag-5'>科学</b>探索研学营开营活动

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018年的西湖大学是由一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息
    的头像 发表于 12-12 15:59 851次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本