0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何借助TigerGraph机器学习工作台加速企业BI

TigerGraph 来源:TigerGraph 作者:TigerGraph 2022-11-29 10:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

什么是图数据库,为什么要关心图?

做出正确的商业决策需要了解任何一个行动或交易之间的关系,因为它们彼此相关。许多企业、数据分析公司和数据科学家正在寻找新的方法来探索连接和关系,看看我们的数据能给我们带来什么额外的见解。

借助图分析,我们认识到,所有的数据其实都代表了现实世界中的一些东西,而现实世界中的几乎所有东西都以某种方式联系在一起。从关系中找到这些新的模式,可以用来为电子商务网站打造更好的产品推荐,使银行在欺诈发生之前找到潜在欺诈者,或者让制造企业找到提高供应链效率的方法。

TigerGraph Cloud是业界首个也是唯一一个分布式原生图数据库即服务,使用户能够更容易地加速采用图,实时处理分析和事务性工作负载。通过最新的3.8版本,你还可以在TigerGraph Cloud上配置你的ML Workbench Jupyter notebook,为你的图数据库和图机器学习开发环境提供一站式体验。

案例:图增强的ML模型检测欺诈行为

世界各地的公司正在投资于图,将其作为一种竞争优势。图算法和机器学习领域的研究表明,通过将数据构建在一个固有的捕捉上下文和关系的图结构中,可以大大改善预测模型的质量。特别是在欺诈领域,图增强的机器学习模型可以学习欺诈交易和行为人之间的潜在关系模式,而传统的ML方法(如XGBoost模型)则无法捕捉。

在这篇博客中,我们将探讨如何应用图算法和图特征来解决欺诈检测问题。我们将展示如何用TigerGraph构建你的图数据集,然后我们将通过一个Jupyter notebook的例子,用GNN模型构建一个端到端的欺诈检测应用程序,使用Ethereum数据集,其中包含账户(有正面和负面标签)和它们之间的交易。下面是schema的样子:

8e7f0058-6f8b-11ed-8abf-dac502259ad0.png

在TigerGraph Cloud上构建你的图

在任何模型开发之前,我们首先需要构建你的图。在这个例子中,我们将使用TigerGraph Cloud的免费版本,这是业界第一个也是唯一一个原生并行图数据库即服务。

要开始使用TigerGraph数据库集群,你只需要通过选择硬件配置来完成集群配置过程。

8f947d10-6f8b-11ed-8abf-dac502259ad0.png

在高级设置部分,确保启用机器学习工作台,然后在入门套件中选择图机器学习,这样它就包括在你的配置集群中。(注意:对于这个版本,我们将只支持单服务器配置,即分区因子=1)

8fb896c8-6f8b-11ed-8abf-dac502259ad0.png

TigerGraph云上的机器学习工作台

TigerGraph云上的机器学习工作台

一旦你的图数据库被配置好了,你将需要添加一个用户和密码,以便用机器学习工作台连接到数据库。只需从左边的 “Clusters “选项卡上点击你刚刚配置的集群的 Access Management”,然后用你的凭证点击 “Add User”。

8ff2a732-6f8b-11ed-8abf-dac502259ad0.png

一旦你添加了一个用户,你现在可以直接利用机器学习工作台,点击左侧面板上的集群,然后点击”Tools” 》 “Machine Learning Workbench”。

901648fe-6f8b-11ed-8abf-dac502259ad0.png

一个新的浏览器窗口将被打开,你将登陆到机器学习工作台的Jupyter服务器。

903b76ce-6f8b-11ed-8abf-dac502259ad0.png

TigerGraph 机器学习工作台有很多很好的教程,包括如何使用pyTigerGraph使用我们的ML功能的例子,运行我们图数据科学库的算法,以及端到端的应用。
你可能已经听说了最近在人工智能/ML方面的图谱神经网络的突破。在这篇博客中,我们将展示利用我们内置的python功能(如图数据分区、数据导出/批处理和图特征工程)建立一个GNN模型是多么容易。该notebook 可以在下面路径找到:GML→ Applications → Fraud_Detection → Fraud_Detection.ipynb.

907382da-6f8b-11ed-8abf-dac502259ad0.png

在运行任何代码之前,你首先需要确保config.json中的用户名和密码(在Jupyter服务器的root文件夹中)被相应地更新为你刚刚从tgcloud.io创建的新用户。

909a23d6-6f8b-11ed-8abf-dac502259ad0.png

准备你的图数据集

现在,我们已经准备好与TigerGraph云数据库实例建立连接,只需运行以下代码,并将Ethereum 数据集导入到你的实例。

90d5dee4-6f8b-11ed-8abf-dac502259ad0.png

图特征工程

像任何其他监督下的机器学习模型一样,GNN需要训练、验证和测试集来开发模型。ML Workbench通过一个简单的命令使数据分区变得简单。我们将对你的图数据进行分区,同时保留你的数据集的关系。

910da70c-6f8b-11ed-8abf-dac502259ad0.png

ML workbench 包括TIgerGraph的图数据科学库中的相当多的图算法来进行特征工程。这个notebook 所强调的关键功能是:

listAlgorithm():如果你输入算法的类别(如中心性),它将打印指定类别的可用算法;否则它将打印所有可用的算法类别。

installAlgorithm():获取算法的名称作为输入,如果该算法尚未安装,则安装该算法。

runAlgorithm():获取算法名称和参数以运行该算法。如果该算法尚未安装,并且存在于TigerGraph的图数据科学库中,该算法将自动安装查询语句,并在图中创建必要的schema属性。

下面的代码显示了如何使用Featurizer来获得PageRank作为一个特征。你也可以通过运行你自己的GSQL查询语句,并通过Featurizer运行它,来定义你自己的自定义特征。

912e2022-6f8b-11ed-8abf-dac502259ad0.png

现在我们已经完成了特征工程,下一步是使用我们的Neighbor Loader函数导出你的训练、验证和测试数据集。你可以用我们的Neighbor Loader函数定义你的采样策略,如批次大小、跳数和邻居数。

914298ea-6f8b-11ed-8abf-dac502259ad0.png

训练你的GNN模型

现在,我们已经完成了图特征工程,并将所有的数据导出到你的机器学习工作台环境,以训练机器学习模型。


我们拥护开源社区,这就是为什么我们把TigerGraph ML Workbench与一些最流行的深度学习框架兼容,如PyTorch Geometric和Tensorflow。注意在上面的代码中,我们直接将你的关联数据以output_format参数中指定的PyG格式导出,你将能够直接利用PyG来训练一个GNN模型,比如Graph Attention Network( (GATs)算法。请看下面的例子:

91808f38-6f8b-11ed-8abf-dac502259ad0.png

一旦你的模型训练完成,你就可以对你的模型进行推理,看看一个欺诈者是如何通过其网络移动交易的。为了更好地解释预测行为,我们可以将与预测顶点相关的子图可视化。

用子图可视化你的模型预测

在这个例子中,顶点#1891被预测为一个欺诈账户。粉红色的顶点是已知的欺诈账户,用蓝色标识的顶点是未知账户。看起来顶点1891是一个欺诈者网络的幕后策划者,一直在从无辜的用户那里拿钱!

91c32d5c-6f8b-11ed-8abf-dac502259ad0.png

下一步

如果你觉得这篇文章很有趣,并想建立自己的GNN应用程序,请免费试用我们的TigerGraph Cloud和TigerGraph ML Workbench。请从我们的Github(https://github.com/tigergraph/graph-ml-notebooks)上查看我们的教程。你也可以在这篇博文中找到我们所用到的notebook例子的链接。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3993

    浏览量

    67745
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136236

原文标题:如何借助TigerGraph机器学习工作台加速企业BI

文章出处:【微信号:TigerGraph,微信公众号:TigerGraph】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    企业实施BI的时机和选择考虑

     在数聚股份看来,如果你的企业还只处在初创阶段,但又需要为日后的BI数据化做准备时。出于成本考虑,你可以先用Excel梳理好业务核心数据,聚焦核心指标,接着发展用户,积累业务数据。  当你
    的头像 发表于 12-02 16:08 131次阅读

    洁净工作台尘埃粒子标准是多少

    洁净工作台的尘埃粒子标准因应用场景和行业规范而异,以下是不同洁净级别的具体要求:百级洁净度≥0.5μm的尘埃粒子数:应≤3,500,000个/立方米;≥5μm的尘埃粒子数:应≤20,000个/立方米
    的头像 发表于 08-26 13:42 974次阅读
    洁净<b class='flag-5'>工作台</b>尘埃粒子标准是多少

    如何为新唐 8051 系列设置 IAR 8051 工作台项目?

    如何为新唐 8051 系列设置 IAR 8051 工作台项目
    发表于 08-25 06:26

    NVIDIA携手诺和诺德借助AI加速药物研发

    NVIDIA 宣布与诺和诺德开展合作,借助创新 AI 应用加速药物研发。此次合作也将支持诺和诺德与丹麦 AI 创新中心 (DCAI) 关于使用 Gefion AI 超级计算机的协议落地。双方将联合
    的头像 发表于 06-12 15:49 987次阅读

    RFID军工仓储工作台,如何引领部队仓储信息化建设新潮流?

    在数字化浪潮汹涌的当代,军事后勤保障的现代化转型已将部队仓储信息化建设推至关键地位。射频识别技术(RFID),作为一项尖端自动识别技术,其在军工仓储领域的突破性应用——RFID军工仓储工作台,正引领
    的头像 发表于 04-08 11:30 636次阅读
    RFID军工仓储<b class='flag-5'>工作台</b>,如何引领部队仓储信息化建设新潮流?

    晶圆湿法清洗工作台工艺流程

    晶圆湿法清洗工作台是一个复杂的工艺,那我们下面就来看看具体的工艺流程。不得不说的是,既然是复杂的工艺每个流程都很重要,为此我们需要仔细谨慎,这样才能获得最高品质的产品或者达到最佳效果。 晶圆湿法清洗
    的头像 发表于 04-01 11:16 883次阅读

    工业机器人工作站的建设意义

    其他辅助设备的配合,形成了一套完整的自动化生产流程。桐尔作为专业的自动化解决方案提供商,致力于通过工业机器人工作站的建设,为企业带来显著的经济效益和生产效率提升。 工业机器人工作站的建立首先能够显著
    发表于 03-17 14:49

    深度剖析:Power BI 与 Domo,谁才是你的最佳 BI 选择?

    企业数据量激增,BI 技术需求强烈,各类 BI 产品涌现。本文对比知名 BI 产品 Power BI 与 Domo。Power
    的头像 发表于 03-07 15:21 1052次阅读
    深度剖析:Power <b class='flag-5'>BI</b> 与 Domo,谁才是你的最佳 <b class='flag-5'>BI</b> 选择?

    在OpenVINO™工具套件的深度学习工作台中无法导出INT8模型怎么解决?

    无法在 OpenVINO™ 工具套件的深度学习 (DL) 工作台中导出 INT8 模型
    发表于 03-06 07:54

    如何排除深度学习工作台上量化OpenVINO™的特定层?

    无法确定如何排除要在深度学习工作台上量化OpenVINO™特定层
    发表于 03-06 07:31

    在Raspberry Pi 4上为OpenVINO™ 2021.4.2安装DL工作台,加载人脸检测-0200模型时遇到错误怎么解决?

    在 Raspberry Pi* 4 上为 OpenVINO™ 2021.4.2 安装的 DL 工作台 加载人脸检测-0200 模型时遇到错误: Unknown model format
    发表于 03-05 07:57

    在深度学习工作台中安装Python软件包报错怎么解决?

    在 DL 工作台中导入的模型。 在准备将导入的模型转换为中间表示 (IR) 时收到错误: Cannot install packages for python /home/workbench/.workbench/environments/2/bin/python
    发表于 03-05 07:32

    如何在DL工作台中启用GPU/MYRIAD/HDDL?

    如何在 DL 工作台中启用 GPU/MYRIAD/HDDL
    发表于 03-05 07:03

    为什么无法通过OpenVINO™深度学习 (DL) 工作台优化 MYRIAD 导入的模型?

    -ASSETS_DIR /hdd-raid0/openvino_workbench 命令以启动 DL 工作台。 收到以下消息: 由于选定的项目具有只读状态,因此无法使用优化按钮 拔下并插入神经电脑棒 (NCS2) 并重新启动工作台容器。 移除了所有资产目录数据并重启容器
    发表于 03-05 06:20

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生
    的头像 发表于 12-25 11:54 702次阅读