0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浪潮分布式存储平台AS13000让企业轻松应对海量数据挑战

浪潮存储 来源:浪潮信息 作者:浪潮信息 2022-08-14 14:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着经济社会加速数字化转型,大数据、云计算人工智能区块链等新一代信息技术快速兴起,智慧政务、金融科技、智慧交通、远程教育、智慧医疗等应用加速落地,包含各种办公文档、图片、视频、音频、设计文档、日志文件、机器数据等的非结构化数据爆发式增长,企业和组织愈发重视海量非结构化数据的管理与应用。如何依靠底层技术让海量非结构化数据的管理和使用更简单?无处不在的元数据给出了答案。

什么是元数据?

元数据是关于数据的数据,人们身边的一切信息和资源都可以用数据来描述,元数据则是从数据资源中抽取用来说明其特征和内容的结构化数据,用于组织、管理、保存、检索信息和资源。虽然人们看不见元数据的存在,但它却无时无刻不伴随左右。人们平时所津津乐道的大数据,也是基于元数据来计算的。

企业和组织用户可以基于元数据对海量非结构化数据进行管理,例如获取后缀名为jpeg的所有图片文件列表、获取文件大小大于10M的文件列表、获取给定日期之前创建的文件列表,在快速获取符合条件的文件之后高效管理对应的数据。而如何更方便快捷地查找到非结构化的文件成为了分布式存储全新的挑战。

原始的数据检索方式较为简单粗暴,难以应对文件多、目录层次深、检索条件复杂等问题。例如Linux中的find查找,对象存储中的前缀检索,都只能遍历所有文件进行筛选。功能上不能满足多样化的检索需求,检索字段有限,检索方式单一;性能上也挑战了底层元数据管理服务的检索能力和检索效率。

浪潮分布式存储基于对元数据检索的研究,在分布式存储平台AS13000上进行技术创新,在对象、文件、大数据三大非结构化存储场景,研发了元数据检索功能。支持对文件名称、路径、类型、大小、自定义元数据、创建时间、修改时间、用户(组)、桶等关键字段进行检索,支持基础检索和逻辑关系自定义等高级检索功能。百亿级文件,亚分钟级检索。

浪潮分布式存储

元数据检索的四大优势

浪潮分布式存储AS13000元数据检索能够同时兼容对象、文件、大数据三大非结构化存储场景,引入Elasticsearch作为元数据检索引擎,支持NFS、CIFS、S3、Swift、HDFS协议。

Elasticsearch是一个可扩展的RESTful风格的分布式数据检索和分析引擎,它能够快速且近实时地存储、检索、分析海量数据,通常用作具有复杂检索应用的底层引擎。传统的分布式存储+Elasticsearch,即为浪潮分布式非结构化存储AS13000元数据检索的核心。

文件的元数据信息会同步至Elasticsearch引擎中,基于此,用户的元数据检索命令通过协议转换,在Elasticsearch中检索出符合要求的文件信息,返回给用户。

比如,浪潮分布式存储具有更全面的协议支撑。浪潮分布式存储AS13000能够同时支持NFS、CIFS、S3、Swift、HDFS协议进行检索;同时支持客户自己的RESTful风格访问程序进行自定义元数据信息检索。

又如,具备更灵活便捷的检索方式。基于上述的结构,浪潮分布式存储AS13000支持了更为丰富的检索手段和快捷的检索速度,对数据存储本身的读写影响更小。支持的检索内容包括两个方面,其一,丰富的检索字段,包括文件名称、路径、类型、大小、创建时间、最后修改时间、用户名、用户组名、桶名,以及用户自定义的元数据信息,都可以作为检索字段。其二,多样的检索逻辑;支持大于、大于等于、小于、小于等于、不等于、等于等算术比较运算符,逻辑支持“并且”“或者”等逻辑运算符。企业可以根据需求在检索界面上进行检索式的组装,且检索结果支持分页展示。

再如,更安全的元数据保护。为了保护用户的元数据信息,避免非法的RESTful请求恶意获取Elasticsearch中的元数据信息,浪潮分布式存储AS13000同时针对Elasticsearch进行了安全限制,针对Elasticsearch提供 数据流加密,同时基于角色进行访问安全校验,保障元数据信息的网络安全。

最后,更便捷的对接方式。浪潮分布式存储AS13000不仅自身能够提供元数据检索服务,同时能够轻松对接客户的Elasticsearch引擎。如果客户原本就有元数据检索引擎,则可以直接部署浪潮分布式存储,对接客户的Elasticsearch,不需要客户更改原本的检索手段,实现无缝切换。

具备元数据检索功能的浪潮分布式非结构化存储AS13000,已经在金融、通信、教科研、医疗等行业规模部署。为企业提供更简单、更丰富、更便捷的元数据检索方式,让企业轻松应对数字经济时代的海量数据挑战。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4693

    浏览量

    89569
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25304
  • 元数据
    +关注

    关注

    0

    文章

    32

    浏览量

    9333

原文标题:浪潮分布式存储:元数据检索的四大优势

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【节能学院】Acrel-1000DP分布式光伏监控系统在奉贤平高食品 4.4MW 分布式光伏中应用

    摘要:在“双碳”和新型电力系统建设背景下,分布式光伏接入比例不断提高,对配电网电压、调度运行及调峰等环节造成强烈冲击。本文设计包含平台层、设备层二层架构体系的分布式光伏管控平台,以及小
    的头像 发表于 08-23 08:04 3306次阅读
    【节能学院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏监控系统在奉贤平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中应用

    AcrelCloud-1200 分布式光伏运维云平台 用于居民屋顶光伏发电

    光伏电站,确保其稳定、安全运行,成为企业亟待解决的问题。安科瑞电气推出的AcrelCloud-1200分布式光伏运维云平台,凭借其良好的性能和丰富的功能,为企业
    的头像 发表于 08-05 10:48 789次阅读
    AcrelCloud-1200 <b class='flag-5'>分布式</b>光伏运维云<b class='flag-5'>平台</b> 用于居民屋顶光伏发电

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时
    的头像 发表于 08-04 11:34 1336次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>效能革命

    安科瑞分布式光伏监控系统:赋能园区企业光伏用电智能化管理

    维成本,成为了园区企业面临的重要挑战。安科瑞分布式光伏监控系统应运而生,为园区企业提供了一套全面、智能的光伏用电管理解决方案。(18721098782----安科瑞) 系统架构:分层
    的头像 发表于 07-30 15:57 489次阅读
    安科瑞<b class='flag-5'>分布式</b>光伏监控系统:赋能园区<b class='flag-5'>企业</b>光伏用电智能化管理

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。
    的头像 发表于 07-14 11:15 713次阅读

    分布式设备管理平台有哪些功能?哪个好用?

    在数字化浪潮中,分布式设备管理平台成为各行业提升设备管理效率、优化运维流程的关键工具。这类平台不仅能够对分布广泛、类型多样的设备进行集中管控
    的头像 发表于 07-07 17:07 612次阅读
    <b class='flag-5'>分布式</b>设备管理<b class='flag-5'>平台</b>有哪些功能?哪个好用?

    曙光存储领跑中国分布式存储市场

    近日,赛迪顾问发布《中国分布式存储市场研究报告(2025)》,指出2024 年中国分布式存储市场首次超过集中式存储,规模达 198.2 亿元
    的头像 发表于 05-19 16:50 1011次阅读

    兆芯+图云创智—可信分布式存储系统解决方案

    图云创智分布式存储系统采用全分布式设计与先进的存储虚拟化技术相结合,由多个独立的兆芯 x86 服务器作为存储节点,联合道熵
    的头像 发表于 04-23 10:29 649次阅读
    兆芯+图云创智—可信<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统解决方案

    分布式存储数据恢复—虚拟机上hbase和hive数据数据恢复案例

    分布式存储数据恢复环境: 16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。 虚拟机上部署Hbase和Hive数据库。
    的头像 发表于 04-17 11:05 513次阅读

    分布式站点设备出现异常故障如何快速定位并进行维护

    一、行业背景 随着数字化、经济化进程的飞速发展,分布式站点在各个行业中的应用愈发广泛。无论是集团企业分布式工厂,还是城市生命线的供水泵站,亦或是负责存储与处理
    的头像 发表于 03-03 11:02 574次阅读
    <b class='flag-5'>分布式</b>站点设备出现异常故障如何快速定位并进行维护

    分布式存储有哪几种类型?

    分布式存储有哪几种类型?分布式存储系统是一种将数据分散存储在多台独立节点上的技术,根据
    的头像 发表于 02-20 11:00 1124次阅读

    应对海量数据挑战,如何基于Euro NCAP标准开展高效智驾测试与评估?

    自动驾驶技术快速发展,海量数据和复杂场景带来性能与安全评估挑战。如何高效管理数据、挖掘关键场景并满足以Euro NCAP为代表的严格评估标准,成为行业核心问题。本文探讨如何
    的头像 发表于 02-12 10:09 4394次阅读
    <b class='flag-5'>应对</b><b class='flag-5'>海量</b><b class='flag-5'>数据</b><b class='flag-5'>挑战</b>,如何基于Euro NCAP标准开展高效智驾测试与评估?

    分布式云化数据库有哪些类型

    分布式云化数据库有哪些类型?分布式云化数据库主要类型包括:关系型分布式数据库、非关系型分布式数据
    的头像 发表于 01-15 09:43 867次阅读

    HarmonyOS Next 应用元服务开发-分布式数据对象迁移数据文件资产迁移

    提供了async版本供该场景使用。 当前,wantParams中“sessionId”字段在迁移流程中被系统占用,建议开发者在wantParams中定义其他key值存储分布式数据对象生成的id,避免
    发表于 12-24 10:11

    HarmonyOS Next 应用元服务开发-分布式数据对象迁移数据权限与基础数据

    提供了async版本供该场景使用。 当前,wantParams中“sessionId”字段在迁移流程中被系统占用,建议开发者在wantParams中定义其他key值存储分布式数据对象生成的id,避免
    发表于 12-24 09:40