0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何借助TigerGraph机器学习工作台加速企业BI

TigerGraph 来源:TigerGraph 作者:TigerGraph 2022-11-29 10:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

什么是图数据库,为什么要关心图?

做出正确的商业决策需要了解任何一个行动或交易之间的关系,因为它们彼此相关。许多企业、数据分析公司和数据科学家正在寻找新的方法来探索连接和关系,看看我们的数据能给我们带来什么额外的见解。

借助图分析,我们认识到,所有的数据其实都代表了现实世界中的一些东西,而现实世界中的几乎所有东西都以某种方式联系在一起。从关系中找到这些新的模式,可以用来为电子商务网站打造更好的产品推荐,使银行在欺诈发生之前找到潜在欺诈者,或者让制造企业找到提高供应链效率的方法。

TigerGraph Cloud是业界首个也是唯一一个分布式原生图数据库即服务,使用户能够更容易地加速采用图,实时处理分析和事务性工作负载。通过最新的3.8版本,你还可以在TigerGraph Cloud上配置你的ML Workbench Jupyter notebook,为你的图数据库和图机器学习开发环境提供一站式体验。

案例:图增强的ML模型检测欺诈行为

世界各地的公司正在投资于图,将其作为一种竞争优势。图算法和机器学习领域的研究表明,通过将数据构建在一个固有的捕捉上下文和关系的图结构中,可以大大改善预测模型的质量。特别是在欺诈领域,图增强的机器学习模型可以学习欺诈交易和行为人之间的潜在关系模式,而传统的ML方法(如XGBoost模型)则无法捕捉。

在这篇博客中,我们将探讨如何应用图算法和图特征来解决欺诈检测问题。我们将展示如何用TigerGraph构建你的图数据集,然后我们将通过一个Jupyter notebook的例子,用GNN模型构建一个端到端的欺诈检测应用程序,使用Ethereum数据集,其中包含账户(有正面和负面标签)和它们之间的交易。下面是schema的样子:

8e7f0058-6f8b-11ed-8abf-dac502259ad0.png

在TigerGraph Cloud上构建你的图

在任何模型开发之前,我们首先需要构建你的图。在这个例子中,我们将使用TigerGraph Cloud的免费版本,这是业界第一个也是唯一一个原生并行图数据库即服务。

要开始使用TigerGraph数据库集群,你只需要通过选择硬件配置来完成集群配置过程。

8f947d10-6f8b-11ed-8abf-dac502259ad0.png

在高级设置部分,确保启用机器学习工作台,然后在入门套件中选择图机器学习,这样它就包括在你的配置集群中。(注意:对于这个版本,我们将只支持单服务器配置,即分区因子=1)

8fb896c8-6f8b-11ed-8abf-dac502259ad0.png

TigerGraph云上的机器学习工作台

TigerGraph云上的机器学习工作台

一旦你的图数据库被配置好了,你将需要添加一个用户和密码,以便用机器学习工作台连接到数据库。只需从左边的 “Clusters “选项卡上点击你刚刚配置的集群的 Access Management”,然后用你的凭证点击 “Add User”。

8ff2a732-6f8b-11ed-8abf-dac502259ad0.png

一旦你添加了一个用户,你现在可以直接利用机器学习工作台,点击左侧面板上的集群,然后点击”Tools” 》 “Machine Learning Workbench”。

901648fe-6f8b-11ed-8abf-dac502259ad0.png

一个新的浏览器窗口将被打开,你将登陆到机器学习工作台的Jupyter服务器。

903b76ce-6f8b-11ed-8abf-dac502259ad0.png

TigerGraph 机器学习工作台有很多很好的教程,包括如何使用pyTigerGraph使用我们的ML功能的例子,运行我们图数据科学库的算法,以及端到端的应用。
你可能已经听说了最近在人工智能/ML方面的图谱神经网络的突破。在这篇博客中,我们将展示利用我们内置的python功能(如图数据分区、数据导出/批处理和图特征工程)建立一个GNN模型是多么容易。该notebook 可以在下面路径找到:GML→ Applications → Fraud_Detection → Fraud_Detection.ipynb.

907382da-6f8b-11ed-8abf-dac502259ad0.png

在运行任何代码之前,你首先需要确保config.json中的用户名和密码(在Jupyter服务器的root文件夹中)被相应地更新为你刚刚从tgcloud.io创建的新用户。

909a23d6-6f8b-11ed-8abf-dac502259ad0.png

准备你的图数据集

现在,我们已经准备好与TigerGraph云数据库实例建立连接,只需运行以下代码,并将Ethereum 数据集导入到你的实例。

90d5dee4-6f8b-11ed-8abf-dac502259ad0.png

图特征工程

像任何其他监督下的机器学习模型一样,GNN需要训练、验证和测试集来开发模型。ML Workbench通过一个简单的命令使数据分区变得简单。我们将对你的图数据进行分区,同时保留你的数据集的关系。

910da70c-6f8b-11ed-8abf-dac502259ad0.png

ML workbench 包括TIgerGraph的图数据科学库中的相当多的图算法来进行特征工程。这个notebook 所强调的关键功能是:

listAlgorithm():如果你输入算法的类别(如中心性),它将打印指定类别的可用算法;否则它将打印所有可用的算法类别。

installAlgorithm():获取算法的名称作为输入,如果该算法尚未安装,则安装该算法。

runAlgorithm():获取算法名称和参数以运行该算法。如果该算法尚未安装,并且存在于TigerGraph的图数据科学库中,该算法将自动安装查询语句,并在图中创建必要的schema属性。

下面的代码显示了如何使用Featurizer来获得PageRank作为一个特征。你也可以通过运行你自己的GSQL查询语句,并通过Featurizer运行它,来定义你自己的自定义特征。

912e2022-6f8b-11ed-8abf-dac502259ad0.png

现在我们已经完成了特征工程,下一步是使用我们的Neighbor Loader函数导出你的训练、验证和测试数据集。你可以用我们的Neighbor Loader函数定义你的采样策略,如批次大小、跳数和邻居数。

914298ea-6f8b-11ed-8abf-dac502259ad0.png

训练你的GNN模型

现在,我们已经完成了图特征工程,并将所有的数据导出到你的机器学习工作台环境,以训练机器学习模型。


我们拥护开源社区,这就是为什么我们把TigerGraph ML Workbench与一些最流行的深度学习框架兼容,如PyTorch Geometric和Tensorflow。注意在上面的代码中,我们直接将你的关联数据以output_format参数中指定的PyG格式导出,你将能够直接利用PyG来训练一个GNN模型,比如Graph Attention Network( (GATs)算法。请看下面的例子:

91808f38-6f8b-11ed-8abf-dac502259ad0.png

一旦你的模型训练完成,你就可以对你的模型进行推理,看看一个欺诈者是如何通过其网络移动交易的。为了更好地解释预测行为,我们可以将与预测顶点相关的子图可视化。

用子图可视化你的模型预测

在这个例子中,顶点#1891被预测为一个欺诈账户。粉红色的顶点是已知的欺诈账户,用蓝色标识的顶点是未知账户。看起来顶点1891是一个欺诈者网络的幕后策划者,一直在从无辜的用户那里拿钱!

91c32d5c-6f8b-11ed-8abf-dac502259ad0.png

下一步

如果你觉得这篇文章很有趣,并想建立自己的GNN应用程序,请免费试用我们的TigerGraph Cloud和TigerGraph ML Workbench。请从我们的Github(https://github.com/tigergraph/graph-ml-notebooks)上查看我们的教程。你也可以在这篇博文中找到我们所用到的notebook例子的链接。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    4083

    浏览量

    68541
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137226

原文标题:如何借助TigerGraph机器学习工作台加速企业BI

文章出处:【微信号:TigerGraph,微信公众号:TigerGraph】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    借助NVIDIA DSX Air平台加速AI基础设施仿真部署

    CoreWeave 等企业已率先采用这一新平台,它支持企业在单台服务器开箱之前,借助经过验证的计算、网络、存储、编排和安全参考架构,对复杂部署进行仿真。
    的头像 发表于 03-19 15:48 376次阅读

    研华科技AI+BI一体化生产运营升级方案助力制造企业打破数据孤岛

    研华AI+BI一体化生产运营升级方案,以BI夯实数据可视底座,以AI突破分析效率边界,助力制造企业打破管理瓶颈、激活数据价值,实现从被动应对到主动管控的数字化转型。
    的头像 发表于 03-19 13:44 327次阅读
    研华科技AI+<b class='flag-5'>BI</b>一体化生产运营升级方案助力制造<b class='flag-5'>企业</b>打破数据孤岛

    湿法刻蚀工作台工艺流程

    湿法刻蚀工作台的工艺流程是半导体制造中的关键环节,以下是对该流程的介绍:预处理表面清洗与去污:使用去离子水、有机溶剂(如丙酮、酒精)或酸碱溶液清洗材料表面,去除油脂、灰尘等污染物,确保后续反应均匀性
    的头像 发表于 01-14 14:04 253次阅读
    湿法刻蚀<b class='flag-5'>工作台</b>工艺流程

    机器学习和深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习和深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注
    的头像 发表于 01-07 15:37 350次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    借助NVIDIA Isaac Sim与World Labs Marble加速机器人仿真环境构建

    一直以来,为机器人仿真构建逼真的 3D 环境是一项非常耗费人力的工作,往往需要数周的手动建模与配置。如今,借助生成式世界模型,开发者只需输入文本提示,就能在极短时间内生成一个逼真、可直接用于仿真
    的头像 发表于 12-24 10:28 1699次阅读

    移动BI可视化分析助力决策分析应用

    的分析与决策应用,实现决策分析无处不在的实时动态管理。移动BI融合了计算机技术、通信技术、互联网技术,消除了时间和空间的限制,企业高层和基层员工均可将移动BI作为辅助决策在有力工具。  移动B
    的头像 发表于 12-03 16:48 698次阅读

    企业实施BI的时机和选择考虑

     在数聚股份看来,如果你的企业还只处在初创阶段,但又需要为日后的BI数据化做准备时。出于成本考虑,你可以先用Excel梳理好业务核心数据,聚焦核心指标,接着发展用户,积累业务数据。  当你
    的头像 发表于 12-02 16:08 383次阅读

    ​让网分走进每一个工作台 —— RIGOL全新DNA5000/6000系列矢量网络分析仪正式发布

    与前所未有的易用性相结合,致力于将网络分析带到每个工程师的测试工作台。   可靠性能,满足核心测试需求 普及,绝不意味着对性能的妥协,DNA5000/6000 系列拥有扎实的核心射频指标,足以胜任工作台
    的头像 发表于 10-21 14:15 527次阅读
    ​让网分走进每一个<b class='flag-5'>工作台</b> —— RIGOL全新DNA5000/6000系列矢量网络分析仪正式发布

    ADI借助NVIDIA Jetson Thor平台加速人形机器人研发进程

    当前,人形机器人正逐步迈向实际应用部署阶段,其落地节奏取决于物理智能与实时推理能力的发展。随着NVIDIA Jetson Thor平台的正式面市,Analog Devices, Inc. (ADI)将进一步加速人形机器人与自主移
    的头像 发表于 08-29 14:07 3496次阅读

    洁净工作台尘埃粒子标准是多少

    洁净工作台的尘埃粒子标准因应用场景和行业规范而异,以下是不同洁净级别的具体要求:百级洁净度≥0.5μm的尘埃粒子数:应≤3,500,000个/立方米;≥5μm的尘埃粒子数:应≤20,000个/立方米
    的头像 发表于 08-26 13:42 2092次阅读
    洁净<b class='flag-5'>工作台</b>尘埃粒子标准是多少

    越疆第10万台机器人成功下线 越疆机器人成为首家出货量突破10万企业

    据悉,越疆协作机器人生产基地第10万台机器人已经正式下线。这意味着越疆机器人成为首家出货量突破10万企业。 深圳市越疆科技股份有限公司成
    的头像 发表于 08-25 19:36 1592次阅读

    如何为新唐 8051 系列设置 IAR 8051 工作台项目?

    如何为新唐 8051 系列设置 IAR 8051 工作台项目
    发表于 08-25 06:26

    Cognizant加速AI模型企业级开发

    -Cognizant推出AI Training Data Services,助力企业级AI模型加速开发 Cognizant是数据与AI模型训练合作伙伴,长期深受大型数字原生先锋企业信赖,助力其训练
    的头像 发表于 07-31 17:25 814次阅读

    FPGA在机器学习中的具体应用

    随着机器学习和人工智能技术的迅猛发展,传统的中央处理单元(CPU)和图形处理单元(GPU)已经无法满足高效处理大规模数据和复杂模型的需求。FPGA(现场可编程门阵列)作为一种灵活且高效的硬件加速平台
    的头像 发表于 07-16 15:34 3096次阅读

    NVIDIA携手诺和诺德借助AI加速药物研发

    NVIDIA 宣布与诺和诺德开展合作,借助创新 AI 应用加速药物研发。此次合作也将支持诺和诺德与丹麦 AI 创新中心 (DCAI) 关于使用 Gefion AI 超级计算机的协议落地。双方将联合
    的头像 发表于 06-12 15:49 1490次阅读