0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ArangoDB在机器学习中的作用

工程师邓生 来源:哲想软件 作者:哲想软件 2022-09-05 09:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ArangoDB具有其固有的多模型功能,非常适合您的机器学习工作负载。ArangoMLPipeline现在可以作为云服务使用——ArangoMLPipeline Cloud。

机器学习基础设施的ArangoML

在构建生产级机器学习基础设施时,ArangoML在整个机器学习生命周期中提供对通用元数据存储的支持,并支持机器学习模型的再现性、监控和审计。

多模型动力机器学习

ArangoDB支持分析任务和多模型机器学习。当处理结构化和非结构化数据的混合时,它特别有用,因为ArangoDB可以本地高效地管理不同的数据模型。

机器学习基础设施的ArangoML

众所周知,训练数据是训练机器学习模型的重要前提。但对于构建生产级机器学习平台,我们实际上应该同样关注另一种类型的数据:元数据。生产机器学习平台由许多不同的步骤和组件组成:

b7009a76-2cb2-11ed-ba43-dac502259ad0.jpg


这些组件中的大多数产生某种元数据,包括例如对数据集的引用、具有相关训练和测试精度的训练运行、模型服务统计、将训练模型链接到用于训练的数据集的来源信息等等。数据科学家和数据操作人员需要通用的元数据存储来回答以下问题:哪个模型是用这个数据集训练的,哪个特性可以产生最佳的测试精度。

b73023f4-2cb2-11ed-ba43-dac502259ad0.jpg


在这里,ArangoML提供了一个简单的界面,可以跨您最喜欢的机器学习框架和工具进行访问。

由于ArangoML由ArangoDB的多模型功能支持,因此它可以存储非结构化数据,例如特定训练运行(文档)的训练统计信息,以及与相关数据集和结果模型的连接(图)。所以上面的查询基本上变成了图遍历。

b7569eb2-2cb2-11ed-ba43-dac502259ad0.jpg


ArangoMLPipeline是一个强大而简单的工具,用于促进数据操作和数据科学之间的团队合作,但也允许为审计员提供详细的审计跟踪和整个机器学习环境的高级分析。

多模型动力机器学习

ArangoDB为不同的数据模型(包括图形、文档和键值)提供本机支持,并允许使用单个查询语言跨所有模型进行查询。

b787b81c-2cb2-11ed-ba43-dac502259ad0.jpg


这些多模型功能在用于特征工程的机器学习平台中特别有用,因为它们使用户能够将不同的数据方面组合成特征,而这些特征又可以被机器学习框架(如TensorFlow或PyTorch)用于训练模型。

b7acd50c-2cb2-11ed-ba43-dac502259ad0.jpg


数据量至关重要,尤其是对于现代深度学习而言。作为分布式数据库的ArangoDB还可以处理对于单个节点来说太大的数据集(例如,图形)。

此外,ArangoDB本机支持大量图算法,包括PageRank、顶点中心性、顶点贴近度、连接组件或社区检测。

所有这些功能使ArangoDB和本地的多种模型成为许多机器学习用例的一个非常有用的工具。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3994

    浏览量

    67865
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136283

原文标题:ArangoML:用于机器学习的ArangoDB

文章出处:【微信号:哲想软件,微信公众号:哲想软件】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    FPGA机器学习的具体应用

    ,越来越多地被应用于机器学习任务。本文将探讨 FPGA 机器学习
    的头像 发表于 07-16 15:34 2655次阅读

    工业数据大型智能工厂作用

    工业数据台作为大型智能工厂数字化转型的核心基础设施,通过整合、管理和利用全链条工业数据,为工厂的智能化运营提供了系统性支撑。以下从多个维度详细解析其大型智能工厂的具体作用: 一、
    的头像 发表于 06-26 17:31 388次阅读

    网线机器人领域如何发挥重要作用

    机器人制造领域正经历前所未有的变革,网络产品作为连接机器人内部系统与外部环境的关键纽带,机器视觉、数据采集和远程控制等环节发挥着决定性作用
    的头像 发表于 04-27 13:33 693次阅读

    安森美图像传感器机器人技术作用

    机器人和自动化技术正在重塑全球各行各业。从仓库到医疗保健设施,这些技术显著提升了生产力、效率和安全性,并实现运营状态的可视化。图像传感器是该技术功能的核心,使机器人能够感知周围环境并与之交互。本文探讨了图像传感器
    的头像 发表于 03-17 17:22 965次阅读

    微型导轨机械起什么作用

    微型导轨机器扮演着重要的角色,主要起导向和定位的作用,同时也为设备提供精确的直线或曲线运动。
    的头像 发表于 02-20 17:49 668次阅读
    微型导轨<b class='flag-5'>在</b>机械<b class='flag-5'>中</b>起什么<b class='flag-5'>作用</b>?

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 641次阅读

    电阻电路作用汇总

    电阻电路作用非常多样且关键,以下是对其作用的全面汇总: 01限流 电阻电路具有显著的
    发表于 02-07 15:53

    嵌入式机器学习的应用特性与软件开发环境

    作者:DigiKey Editor 许多嵌入式系统,必须采用嵌入式机器学习(Embedded Machine Learning)技术,这是指将
    的头像 发表于 01-25 17:05 1249次阅读
    嵌入式<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用特性与软件开发环境

    人工智能之机器学习推荐系统的应用

    机器学习推荐系统中发挥着关键作用,提升用户体验和业务价值。 协同过滤算法是常用方法。基于用户行为数据,如购买记录、浏览历史,计算用户或物品间相似度。比如,用户 A 和用户 B 购买过
    的头像 发表于 01-21 16:19 816次阅读

    xgboost图像分类的应用

    和易用性,各种机器学习任务得到了广泛应用,包括分类、回归和排序问题。图像分类领域,尽管深度学习
    的头像 发表于 01-19 11:16 1592次阅读

    传统机器学习方法和应用指导

    在上一篇文章,我们介绍了机器学习的关键概念术语。本文中,我们会介绍传统机器学习的基础知识和多
    的头像 发表于 12-30 09:16 1996次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 713次阅读

    【「具身智能机器人系统」阅读体验】+数据具身人工智能的价值

    嵌入式人工智能(EAI)将人工智能集成到机器人等物理实体,使它们能够感知、学习环境并与之动态交互。这种能力使此类机器人能够人类社会中有效
    发表于 12-24 00:33

    zeta机器学习的应用 zeta的优缺点分析

    探讨ZETA机器学习的应用以及ZETA的优缺点时,需要明确的是,ZETA一词不同领域可能
    的头像 发表于 12-20 09:11 1641次阅读

    cmp机器学习作用 如何使用cmp进行数据对比

    机器学习领域,"cmp"这个术语可能并不是一个常见的术语,它可能是指"比较"(comparison)的缩写。 比较机器
    的头像 发表于 12-17 09:35 1343次阅读