0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对象存储适合AI和机器学习工作负载的三个原因

如意 来源:51cto 作者:51cto 2020-07-06 09:27 次阅读

各种各样的企业在加快AI机器学习项目,但要真正发挥潜力,需要克服重大的技术障碍。虽然计算基础架构常常是关注的重点,但存储同样重要。这三个主要的原因表明了为什么对象存储(而不是文件存储或块存储)特别适合AI和机器学习工作负载:

1. 可扩展性——有庞大且多样的数据源可供学习时,AI和机器学习最有效。数据科学家利用这些丰富的数据来训练领域模型。在“大数据的五个V”(容量、种类、速度、准确性和价值)中,前两个(容量和种类)最重要。简而言之,AI和机器学习依赖大量多样化的数据(图像、文本、结构化和半结构化数据),构建有用的模型、提供准确的结果并最终提供业务价值。

对象存储是最具扩展性的存储架构,特别适合支持AI和机器学习所需的大量数据。对象存储旨在通过横向扩展方法支持无限增长,使企业组织能够通过随时随地添加节点来扩大部署范围。由于对象存储使用单个全局命名空间,也可以同时跨多个地方进行这种扩展。另一方面,文件和块系统通常采用纵向扩展方法。这意味着这种平台通过为单个节点添加更多计算资源实现纵向扩展,这种方法最终受到限制。它们无法通过部署额外节点来增加计算资源以高效地横向扩展。

2. API——健壮灵活的数据API对于AI和机器学习很重要,如前所述,AI和机器学习使用多种类型的数据。存储平台需要支持API以容纳各种数据。此外,AI和机器学习方面的创新日益在公共云上完成,但是仍有相当一部分的AI和机器学习在本地或私有云中进行,这取决于使用场合的具体情况(比如说,科学研究和医疗保健等领域的容量密集型工作负载往往最适合私有云)。这意味着企业需要在公共云和本地/私有云中都支持工作负载的存储API。

文件和块存储平台在它们支持的API方面受到限制,部分原因是它们是较旧的架构。相比之下,对象存储使用云端更高级的API,这种API旨在以应用程序为中心,并支持比文件和块存储更广泛的API,包括版本控制、生命周期管理、加密、对象锁定和元数据。此外,支持AI和机器学习使用场景的新对象存储API(比如支持流数据和海量数据集的查询)也有可能。

由于对象存储API围绕Amazon S3实现了标准化,更容易整合本地和公共云中的软件。企业可以轻松地将部署的AI和机器学习从本地/私有云环境扩展到公共云,或者将云原生的AI和机器学习工作负载迁移到本地环境,功能不会减损。这种双模式方法使企业能够以合作、可互换的方式利用本地/私有云和公共云上的资源。

由于S3 API已成为对象存储事实上的标准,许多软件工具和库都可以充分利用该API。这允许共享代码、软件和工具,促进AI/机器学习社区更快速的开发。例子包括流行的机器学习平台,比如拥有内置S3 API的TensorFlow和Apache Spark。

3.元数据——与API一样,使用AI和机器学习的企业利用无限制、可自定义的元数据显得至关重要。元数据就是关于数据的数据——从最基本的层面上讲,某个数据何时在何地创建、创建者是谁。但是元数据可以描述更多信息:用户可以创建任意的元数据标签来描述他们需要的任何属性。

数据科学家需要丰富的元数据来查找特定数据以构建和使用AI和机器学习模型。随着更多信息添加到数据中,元数据注释便于逐步积累知识。

文件和块存储仅支持有限的元数据,比如上述基本属性。这在很大程度上归结为可扩展性,因为文件和块系统无力支持快速无缝的增长,如果存储系统为依赖庞大数据集的AI和机器学习应用程序支持丰富的元数据,自然会出现这种情况。然而,对象存储支持无限制的、完全可自定义的元数据,从而更容易找到用于AI和机器学习算法的数据,并从中获得更准确的信息。

以一家医院针对X射线图像使用图像识别应用程序为例:有了元数据,可以使用TensorFlow模型来分析添加到对象存储系统的每个图像,然后为每个图像分配细化的元数据标签(比如,伤病类型、基于骨骼大小或生长情况来判断患者的年龄或性别)。然后可以针对该元数据训练TensorFlow模型,并加以分析,对患者获得新的宝贵信息(比如说,二三十岁的女性比五年前更容易患骨骼疾病)。

几乎每家《财富》 500强公司都在大张旗鼓地搞AI和机器学习,可以想象这些技术在可预见的将来将是最重要的企业IT项目。然而,AI/机器学习项目要获得回报,企业就要使用合适的存储基础架构。由于可扩展性、支持各种API(尤其是S3)和丰富的元数据,对象存储可谓是AI和机器学习的最佳支柱。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    12

    文章

    3855

    浏览量

    84660
收藏 人收藏

    评论

    相关推荐

    想用STM32F373的三个SDADC同步采集电压信号,DMA是工作在什么模式?怎么配置?

    我想用STM32F373的三个SDADC同步采集电压信号,请问如果要搭配DMA工作,DMA是工作在什么模式?怎么配置?(没有看到像F4系列的重ADC采样的
    发表于 03-28 06:49

    STM32F407VET6串口5的三个引脚TX RX GND跟STM32F103VET6串口5的RX TX GND三个引脚相连后烧毁的原因

    我把STM32F407VET6芯片的串口5的三个引脚TX RX GND分别跟STM32F103VET6串口5的RX TX GND 三个引脚直接相连后!上电103芯片发烫,烧毁!不知道什么原因?芯片内部应该都有上下拉电阻吧!
    发表于 03-26 08:03

    电机空转没事,带负载就转不起来是什么原因

    电机空转没事,带负载就转不起来是什么原因  电机空转没问题,但带负载无法转动可能是由于多种原因引起的。 首先,让我们了解电机的工作原理。电机
    的头像 发表于 02-02 18:15 3399次阅读

    三个高速放大器中的一出现震荡是什么原因

    三个高速放大器中的一出现震荡,请问这是什么原因
    发表于 11-27 07:54

    AI Transformer模型支持机器视觉对象检测方案

    使用机器视觉进行对象检测需要 AI 模型/算法在 AI 芯片、FPGA 或模块上运行。它们通常被称为“人工智能引擎”。在首次训练后,可以部署 AI
    发表于 11-23 10:31 207次阅读
    <b class='flag-5'>AI</b> Transformer模型支持<b class='flag-5'>机器</b>视觉<b class='flag-5'>对象</b>检测方案

    对象存储有什么用

    对象存储(Cloud Object Storage,COS)是一种存储海量文件的分布式存储服务,具有高扩展性、低成本、可靠安全等优点。 对象
    的头像 发表于 11-01 16:02 259次阅读
    <b class='flag-5'>对象</b><b class='flag-5'>存储</b>有什么用

    POSIX适合对象存储吗?

    最近,留意到 MinIO 官方博客的一篇题为“在对象存储上实现 POSIX 访问接口是坏主意[1]”的文章,作者以 S3FS-FUSE 为例分享了通过 POSIX 方式访问 MinIO 中的数据时碰到了性能方面的困难,性能远不如直接访问 MinIO。
    的头像 发表于 10-29 10:19 370次阅读
    POSIX<b class='flag-5'>适合</b><b class='flag-5'>对象</b><b class='flag-5'>存储</b>吗?

    AI智能呼叫中心

    、数据驱动决策以及人力成本节约,旨在深入剖析其核心优势和对企业的重要意义。一、自动化处理AI智能呼叫中心通过引入自然语言处理(NLP)、机器学习和自动化技术,使得呼叫中心的处理过程更加高效和准确,
    发表于 09-20 17:53

    机器学习的应用 ST机器学习解决方案助力车企探索汽车AI可能性

    意法半导体的首款车规机器学习解决方案 SL-AIAID012401V1 由 AEKD-AICAR1 评估套件、 AI 人工智能插件和 AutoDevKit 车规开发板组成,能够识别驻车、正常路况
    的头像 发表于 09-15 08:25 960次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的应用 ST<b class='flag-5'>机器</b><b class='flag-5'>学习</b>解决方案助力车企探索汽车<b class='flag-5'>AI</b>可能性

    机器学习和人工智能可轻松地满足存储需求

    的是,机器学习和人工智能 (AI) 可以更轻松地满足存储需求。   机器学习 与现代公司收集更多
    的头像 发表于 09-13 09:08 493次阅读

    云优化性能:使用基于闪存的存储的I/O密集型工作负载

    电子发烧友网站提供《云优化性能:使用基于闪存的存储的I/O密集型工作负载.pdf》资料免费下载
    发表于 08-28 10:04 0次下载
    云优化性能:使用基于闪存的<b class='flag-5'>存储</b>的I/O密集型<b class='flag-5'>工作</b><b class='flag-5'>负载</b>

    机器学习算法入门 机器学习算法介绍 机器学习算法对比

    ,讨论一些主要的机器学习算法,以及比较它们之间的优缺点,以便于您选择适合的算法。 一、机器学习算法的基本概念
    的头像 发表于 08-17 16:27 625次阅读

    利用扩展型 NAS 存储加速 AI/ML 工作负载

    虹科方案1AI&ML变革日常生活AI(人工智能)和ML(机器学习)的发展正逐渐渗透到我们的日常生活中,为我们带来了翻天覆地的变化。从智能手机中的语音助手到智能家居设备,
    的头像 发表于 08-05 08:11 414次阅读
    利用扩展型 NAS <b class='flag-5'>存储</b>加速 <b class='flag-5'>AI</b>/ML <b class='flag-5'>工作</b><b class='flag-5'>负载</b>

    创建一边缘机器学习系统

    SoC选择特定的IP •如何配置IP块以在此SoC中使用它们 •如何将IP片段连接在一起其目的是提供一关于各个知识产权如何协同工作的广泛视角。使用呈现的SoC以本指南为例。预计您将定制SoC以适合您的确
    发表于 08-02 11:02

    机器学习之新功能对象分类

    电子发烧友网站提供《机器学习之新功能对象分类.zip》资料免费下载
    发表于 06-19 15:45 0次下载
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>之新功能<b class='flag-5'>对象</b>分类