0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

《机器学习实战-基于Sophon平台的机器学习理论与实践》现已问世

倩倩 来源:北国网 2020-01-16 08:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

星环科技人工智能平台团队合著的《机器学习实战-基于Sophon平台的机器学习理论与实践》现已问世,该书由机械工业出版社出版,凝结星环科技人工智能和大数据团队丰富的实战经验。

从技术视角提供当前人工智能相关技术的深入介绍,不仅讲解人工智能知识体系的理论基础,也指导基于实战平台的环境进行操作。

这是一本面向机器学习一线工程技术人员的实战指南。除了算法原理讲解,本书还结合实际业务问题,串联起各种工具,手把手教您快速搭建模型,构建行业应用。

本书特色

人工智能已然成为了本时代的新动力——它正在革新世界各地的工业,并从根本上改变我们工作的方式。随着技术体系越来越复杂,应用场景日益广泛,开发门槛也越来越高。在这种情况下,需要一本关于机器学习的专业图书,不仅讲解关于整体知识体系的理论基础,也可以提供基于人工智能研发实战平台环境的操作指导。

《机器学习实战:基于Sophon平台的机器学习理论与实践》在讲解AI的算法原理的基础上,还指导针对真实业务问题,如何快速搭建模型,构建机器学习的行业应用。

1. 紧接地气:本书由星环科技人工智能平台研发团队合著,凝聚了来自算法专家及一线软件工程专家的实战经验。相比于国内学术人员的教材或国外译注,本教材案例来自本土真实的业界实践,更加贴合国内机器学习产业的需求。

2. 注重实践:与基于Python等特定语言的机器学习入门教材不同,本书不拘泥于具体功能的代码实现,更关注技术大方向与业务落地的有机结合。

3. 新手友好:对于机器学习的各环节,本教材采用交互式的平台Sophon进行落地,各环节高度可视化。对于有基础的编程爱好者,可以扩展视野,看看平台带来的效率提升,并无缝迁移文本代码至新平台;对于零基础的读者,可以快速搭建并跑通完整的机器学习流程,提升入门机器学习的自信心。

针对各种类型的机器学习问题,基于星环自研的人工智能平台(Sophon)环境,结合真实案例,依照数据、分析、建模的演进历程以及系统化阐述并进行实战讲解。

通过原理讲解与实例分析,读者既能了解人工智能相关的算法原理,也能了解人工智能一些可落地的具体应用场景。此外,本书还适合作为Sophon平台工具的使用手册,供平台用户参考。

本书既适合作为高等院校计算机、软件工程、人工智能等相关专业的教学用书,同时也可供从事机器学习相关领域的工程技术人员阅读和参考,帮助掌握机器学习相关的算法原理,并能通过专业工具平台快速搭建各类模型,构建机器学习的行业应用。

星环科技作为国内大数据和人工智能平台的领航者,专注于企业级容量云计算、大数据和人工智能核心平台的自主研发。星环科技Sophon集合基础算法、实体画像、视频分析、知识图谱、云服务、边缘计算和管理组件等多个模块的能量,可以让用户快速完成从特征工程、模型训练再到模型上线应用的机器学习全生命周期的开发工作。

关于我们

星环科技人工智能平台团队由五十多位优秀的研发工程师和算法工程师组成,逾八成具有国内外名校硕士及以上学历。其中研发子团队的工作重心为一站式人工智能建模平台Sophon;算法子团队则负责基础算法的研发及改进,并在数据挖掘、传统机器学习、计算机视觉、自然语言处理、知识图谱等领域进行前瞻性研究以及项目实施落地。星环科技人工智能平台团队一直致力于“把中国人自主研发的领先创新技术赋能全世界各行各业,促进社会可持续发展,通过科技让人类的生活更美好”。目前产品应用已覆盖金融、安防、电力、交通、教育等数十个行业和领域,申请专利近三十个。

下面,我们将用一个商户反欺诈的例子,串起本书的主要章节内容。

1 案例背景

随着移动支付的推广,传统的POS机刷卡已经逐步被新兴二维码POS机刷码所取代。同时,传统的线下商铺刷卡套现也逐步演化为网络购物套现、个人POS机套现、微商及线上商铺套现等多种方式。

POS刷卡刷码的流程如下图所示:

银行或第三方支付平台首先向商家推广POS机,然后持有银行卡的消费者就可以在相应商铺使用POS机刷卡消费,或者也可以将银行卡与支付平台绑定,再在商铺使用POS机刷码消费。这一过程中很有可能产生套现欺诈行为,而我们可以使用机器学习方法对商户与消费者间交易行为建模,通过模型自动检测异常商户。

处理这类案例时,我们会先将抽象的业务目标转化为机器可理解的问题,根据我们手中的数据和业务目标构想模型。整个机器学习的过程包含数据预处理及探索性分析、特征提取及选择、模型构建及训练和模型评估。问题建模的流程如下图所示:

2 数据预处理与探索性分析

这一过程包含箱线图、条形图和数据分布特征研究等初步的数据探索、数据的归一化处理、类别特征数据的独热编码或高势集特征编码处理、时间特征数据的连续性变换或时间窗口提取处理等操作,为后续模型的构建及模型收敛速度和精度的提升做了铺垫。

3 特征提取及选择

在POS套现的案例中,我们将构建四种特征,其构建流程如下:

1. 将消费者和商家的静态属性信息作为静态特征;

2. 将商家与消费者之间的动态交易记录作为交易特征,同时加入了商户的平均交易额度等商户深度数据;

3. 分析得到消费者和商家交易图的模式结构特性、传播特征、聚类特征等图结构特征;

使用图嵌入算法和异常检测算法 LOF得到用嵌入特征表示的深度图特征

若数据存在于多个表格中,则可以运用DFS(深度特征融合)进行数据表关联,特征基元以及自动特征搜索与组合(Sophon中提供了自动多表扩展算子的接口供建模使用)。自动特征构建出的特征则可以使用不同类型的评价指标(如LRLogLossMetric、SquaredLossMetric和EntropyBasedMetric)进行评价,再使用一些局部最优方法进行选择(Sophon中的AutoML模块专门提供了自动特征构建算子供使用)。

4 模型构建及训练

1.分类模型:将银行业务人员预先指定的异常商户标签作为分类目标,训练一个分类模型(如逻辑回归模型),再根据模型结果判定新商户是否异常;

2.回归模型:将异常商户标签经交易网络传播后的异常值作为拟合目标,训练一个回归模型(如线性回归模型),再根据模型结果预测商户未来出现套现异常的等级;

3.图计算模型:计算图结构及图特征,辅助对交易行为进行可视化图分析

当我们担心单一的分类/回归模型性能无法满足需求时,可以使用集成学习,将XGBoost回归、决策树回归/SVM、多层感知机和梯度提升树等各类模型进行简单平均/投票融合,集合成一个强学习器,从而得到一个具有比单独学习算法更好预测性能的结果。而当算法性能受到诸如训练过程和正则化方法等选择的设计决策影响时,则可以选择使用自动建模。

另外,可视化图分析能够提供大量信息。如图所示:AB 两个诈骗商铺的顾客中大多使用非信用卡交易,而其共同消费者(疑似欺诈团伙)却大都使用信用卡交易,很可能在实施信用卡套现等诈骗行为。结合商户信息的查询结果:这两个店铺物理距离相距超过 30 公里,且这几个消费者短时间内同时在这两家发生了消费,也佐证了可视化图提供的信息。

5 模型评估

以判定商户是否异常的分类模型为例,我们选择混淆矩阵、ROC曲线与PR曲线进行模型评估。

从图中可以看到,在使用了前面所述特征进行模型训练使得测试集上模型的精度和召回率分别达到 0.925 和 0.7,基本能够满足商户异常监测场景的需要。

从以上分析案例可以看到,Sophon的各个算法算子和可视化分析工具,能够帮助有数据分析需求的业务人员更好地上手使用机器学习对相关业务案例进行分析,同时也使得整个模型搭建流程和结果展示更加清晰,帮助业务人员更好地研究场景问题,助力业务目标的达成。

此外,我们还可以借助自然语言处理和计算机视觉技术,将更多关于商户和消费者的非结构化信息纳入模型,形成更综合化的分析体系。更多主题将在后续的独立文章中呈现,敬请期待。

内容提前知

本书内容覆盖了机器学习领域从理论到实践的多个主题,总共分为10章。

1

第一章 机器学习导论

介绍机器学习的背景、定义和任务类型,构建机器学习应用的步骤,以及开发机器学习工作流的方式。

2

第二章 数据预处理与特征工程

详细介绍数据预处理和特征工程技术,并辅以实例进行验证。

3-6

第三~六章

介绍回归模型、分类模型、模型融合和聚类模型,这些内容是机器学习理论和实践中的传统重点。其中不仅介绍各种常见数据类型的处理方法,还针对删失数据进行了专门的综述和实践。

7

第七章 图计算

介绍机器学习领域较难的图计算话题,并从工业界视角解读如何将图计算落地。

8

第八章 自动机器学习

针对特征工程、建模过程中大量调参的场景介绍自动机器学习的理论和应用,并细致比较和测试了各种自动特征工程算法在不同数据上的表现。

9

第九章 自然语言处理

介绍自然语言处理(词向量、序列标注、关键词抽取、自动摘要和情感分析)技术,使用新闻文本数据搭建文本分类的流程。

10

第十章 计算机视觉

介绍计算机视觉中图像分类和目标检测的应用以及车辆检测的落地案例。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50519

    浏览量

    267767
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137422
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    端到端模仿学习实战:幻尔科技LeRobot如何从“被动执行”进化为“自主学徒”

    ”与“智能学徒”的本质区别。最显著的体现,就是LeRobot所具备的端到端模仿学习能力——它从根本上改变了机器人的技能习得方式,实现了从被动“执行”到自主“学习”的跨越。
    的头像 发表于 05-18 10:58 763次阅读
    端到端模仿<b class='flag-5'>学习</b><b class='flag-5'>实战</b>:幻尔科技LeRobot如何从“被动执行”进化为“自主学徒”

    在阿里云PAI平台机器人感知强化学习规模化实践

    物理 AI 正在迅速从基础运动控制迈向更复杂的环境理解。传统机器人强化学习(RL)长期依赖本体感知(proprioception),包括关节角度、力矩反馈和内部状态,来训练灵巧的运动技能。
    的头像 发表于 05-18 10:34 369次阅读
    在阿里云PAI<b class='flag-5'>平台</b>的<b class='flag-5'>机器</b>人感知强化<b class='flag-5'>学习</b>规模化<b class='flag-5'>实践</b>

    机器学习中的数据质量双保障:从“验证”到“标记”

    机器学习的世界里,有句老话尤为贴切:“garbagein,garbageout”(输入垃圾,输出垃圾)。无论模型架构多先进、算法多精妙,数据的质量始终是决定模型性能的核心。本文聚焦数据处理中两个
    的头像 发表于 04-24 15:48 173次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>中的数据质量双保障:从“验证”到“标记”

    人工智能与机器学习在这些行业的深度应用

    自人工智能和机器学习问世以来,多个在线领域的数字化格局迎来了翻天覆地的变化。这些技术从诞生之初就为企业赋予了竞争优势,而在线行业正是受其影响最为显著的领域。人工智能(AI)与机器
    的头像 发表于 02-04 14:44 777次阅读

    强化学习会让自动驾驶模型学习更快吗?

    是一种让机器通过“试错”学会决策的办法。与监督学习不同,监督学习是有人提供示范答案,让模型去模仿;而强化学习不会把每一步的“正确答案”都告诉你,而是把环境、动作和结果连起来,让
    的头像 发表于 01-31 09:34 939次阅读
    强化<b class='flag-5'>学习</b>会让自动驾驶模型<b class='flag-5'>学习</b>更快吗?

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注数据、模型架构
    的头像 发表于 01-07 15:37 411次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    从0到1,10+年资深LabVIEW专家,手把手教你攻克机器视觉+深度学习(5000分钟实战课)

    “告别检测系统能力缺陷!10+年LabVIEW视觉资深专家手把手教你:5000+分钟高清教程(含工具、算法原理、实战操作、项目优化全流程讲解)”——从传统视觉算法→深度学习建模→工业级部署"
    的头像 发表于 12-02 08:07 878次阅读
    从0到1,10+年资深LabVIEW专家,手把手教你攻克<b class='flag-5'>机器</b>视觉+深度<b class='flag-5'>学习</b>(5000分钟<b class='flag-5'>实战</b>课)

    如何在机器视觉中部署深度学习神经网络

    人士而言往往难以理解,人们也常常误以为需要扎实的编程技能才能真正掌握并合理使用这项技术。事实上,这种印象忽视了该技术为机器视觉(乃至生产自动化)带来的潜力,因为深度学习并非只属于计算机科学家或程序员。 从头开始:什么
    的头像 发表于 09-10 17:38 1130次阅读
    如何在<b class='flag-5'>机器</b>视觉中部署深度<b class='flag-5'>学习</b>神经网络

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题?

    如何解决开发机器学习程序时Keil项目只能在调试模式下运行,但无法正常执行的问题
    发表于 08-28 07:28

    贸泽电子2025边缘AI与机器学习技术创新论坛回顾(上)

    2025年,随着人工智能技术的快速发展,边缘AI与机器学习市场迎来飞速增长,据Gartner预计,2025年至2030年,边缘AI市场将保持23%的复合年增长率。
    的头像 发表于 07-21 11:08 1389次阅读
    贸泽电子2025边缘AI与<b class='flag-5'>机器</b><b class='flag-5'>学习</b>技术创新论坛回顾(上)

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3180次阅读

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    。 持续进修与专业培训 参加线上课程平台学习,如Coursera、edX等。这些平台上有许多知名大学和机构提供的AI相关课程,例如斯坦福大学的机器
    发表于 07-08 17:44

    机器学习异常检测实战:用Isolation Forest快速构建无标签异常检测系统

    本文转自:DeepHubIMBA无监督异常检测作为机器学习领域的重要分支,专门用于在缺乏标记数据的环境中识别异常事件。本文深入探讨异常检测技术的理论基础与实践应用,通过Isolatio
    的头像 发表于 06-24 11:40 1671次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>异常检测<b class='flag-5'>实战</b>:用Isolation Forest快速构建无标签异常检测系统

    零基础学习LuatOS编程:快速上手开发实战教程!

    无论你是刚接触物联网编程的新手,还是希望拓展技能的技术爱好者,本教程将为零基础的读者提供一条清晰的LuatOS学习路径。从安装开发工具到编写第一个程序,我们将通过实例讲解核心概念,助你快速实现从理论
    的头像 发表于 06-13 17:27 810次阅读
    零基础<b class='flag-5'>学习</b>LuatOS编程:快速上手开发<b class='flag-5'>实战</b>教程!

    机器学习赋能的智能光子学器件系统研究与应用

    与应用 在人工智能与光子学设计融合的背景下,科研的边界持续扩展,创新成果不断涌现。从理论模型的整合到光学现象的复杂模拟,从数据驱动的探索到光场的智能分析,机器学习正以前所未有的动力推动光子学领域的革新。据调查,目前在Nature
    的头像 发表于 06-04 17:59 815次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>赋能的智能光子学器件系统研究与应用