0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鲲鹏BoostKit 2.0分布式存储全局缓存如何加速数据存储倍数级

7riU_gh_3a181fa 来源:华为计算 作者:华为计算 2021-12-24 10:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在华为全联接2021上,鲲鹏应用使能套件BoostKit(以下简称“鲲鹏BoostKit”)正式升级为2.0,提供 “数据亲和”加速组件,对数据全处理流程进行负载优化,从而大幅提升应用性能。本期由华为计算产品线算法专家陈泽晖和何智文向大家展示鲲鹏BoostKit 2.0分布式存储全局缓存(Global Cache)特性如何做到数据存储和处理的倍数级加速能力。

在摩尔定律的驱使下,计算能力倍数级增长,但数据传输速度过慢导致大量计算资源浪费,也限制了系统性能发挥。例如,在金融行业,银行逐步采用AI技术对客户信息、远程开户录像、客服中心语音、企业资料等数据进行挖掘与利用,对海量文件的读写会占用大量计算资源,导致业务处理效率降低。

原生Ceph IO请求的处理路径长,导致IO时延高,用户数据读写时间长

鲲鹏BoostKit分布式存储全局缓存应运而生,通过缓存前后台分离、IO聚合、智能预取三大创新技术实现典型读写场景IOPS提升10倍,IO时延降低90%,意味着同样时间内银行处理的交易笔数提升10倍,而且每笔交易处理时长降低90%!

测试模型:4K IO,7:3混合随机读写;硬件配置:256GB内存,25GE网络,每节点12 * 8TB SATA HDD,2 * 3.2TB NVMe SSD

下面带你1分钟get三大创新技术:

1. 缓存前后台分离——缩短数据处理路径:降低IO请求的线程数量,上层应用只需要将数据写入到缓存池或从缓存池中读取即可响应用户请求。

在数据写入场景,数据到写缓存后就可以给上层应用返回数据写入成功,无需与后台Ceph存储集群等分布式存储软件交互,用户业务应用无感知

2. 智能预取——读加速:将数据提前加载至读缓存,实现80%以上缓存命中率和2倍以上读性能加速。

基于IO数据统计,智能分析IO模型特征,实现缓存命中率大幅提升

3. IO聚合——写加速:技术通过批量数据聚合,实现全周期随机写入转顺序写入,实现满带宽性能。

在缓存中把各种大小的数据块聚合成以8M为单位的大数据块,从随机小IO转变成顺序大IO写入后端Ceph等分布式存储集群

此外,BoostKit全局缓存面向鲲鹏生态,结合硬件特点开展软硬协同优化,如CPU亲和、NUMA亲和等,进一步达到“数据亲和”,在不增加硬件成本的前提下,全局缓存面向全命中和真实业务负载提供2~10倍端到端读写性能加速能力。

原文标题:BoostKit干货店|同样硬件,Ceph存储性能提升10倍

文章出处:【微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    36285

    浏览量

    262999
  • 数据存储
    +关注

    关注

    5

    文章

    1039

    浏览量

    53039
  • ai技术
    +关注

    关注

    1

    文章

    1316

    浏览量

    25833

原文标题:BoostKit干货店|同样硬件,Ceph存储性能提升10倍

文章出处:【微信号:gh_3a181fa836b6,微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI Ceph 分布式存储教程资料大模型学习资料2026

    的快速扩缩容,分布式存储必须支持模型文件的秒分发。通过利用分层存储策略,将冷数据归档至廉价的大容量 HDD,将热
    发表于 05-01 17:35

    2022全新版!Java分布式架构设计与开发实战(完结)

    2022全新版!Java分布式架构设计与开发实战(完结) 分库表实战:Java海量数据存储架构设计 在现代互联网应用中,随着业务规模的指数
    发表于 03-30 15:20

    呼伦贝尔2026年分布式能源政策新发布,安科瑞帮助企业搭乘建设快车

    引言 2026年3月12日,呼伦贝尔市能源局正式印发《呼伦贝尔市2026年分布式能源工作方案》,并同步启动第一批次项目申报工作,申报截止时间为3月23日。这份文件是呼伦贝尔市推进分散风电和分布式
    的头像 发表于 03-17 10:16 296次阅读
    呼伦贝尔2026年<b class='flag-5'>分布式</b>能源政策新发布,安科瑞帮助企业搭乘建设快车

    TiDB分布式数据库运维实践

    TiDB 是 PingCAP 开发的开源分布式关系型数据库,兼容 MySQL 5.7 协议,底层存储基于 TiKV(分布式 KV 存储)和
    的头像 发表于 03-04 15:44 402次阅读

    分布式数据恢复—Ceph+TiDB数据恢复报告

    故障情况:客户设备为Ceph分布式存储系统,采用RBD(RADOS Block Device)作为块存储服务。Ceph集群由多个OSD(Object Storage Daemon)节点组成,
    的头像 发表于 02-03 17:22 319次阅读
    <b class='flag-5'>分布式</b><b class='flag-5'>数据</b>恢复—Ceph+TiDB<b class='flag-5'>数据</b>恢复报告

    国内分布式AI存储方案商港股IPO!

    解决方案,即AI数据存储与AI训推存储解决方案,实现AI存储在企业客户业务运营中的无缝部署及实施,解决企业在AI转型过程中的关键存储需求。
    的头像 发表于 01-29 13:44 9008次阅读
    国内<b class='flag-5'>分布式</b>AI<b class='flag-5'>存储</b>方案商港股IPO!

    MR30分布式I/O助力物流分拣系统智能化升级

    本文以MR30分布式I/O在某大型电商物流中心分拣系统的应用为例,详细阐述其在合流、分拣、分流、分运全流程中的模块化应用方案。
    的头像 发表于 10-31 10:58 1217次阅读
    MR30<b class='flag-5'>分布式</b>I/O助力物流分拣系统智能化升级

    MR30分布式IO在自动上料机的应用

    。本文结合该企业生产实际,详细阐述自动上料机的生产工艺需求,深入分析MR30分布式IO的应用方式,并通过实际数据验证其应用成效。 本期案例使用的产品:MR30-32DI、MR30-32DO、MR30-16AI-I4W、MR30-TM-2CNT​. 工艺概述​ 本次应用场景
    的头像 发表于 10-30 14:05 465次阅读
    MR30<b class='flag-5'>分布式</b>IO在自动上料机的应用

    MR30分布式I/O模块在化工行业的应用

    氧化铝是生产金属铝的核心原料,广泛用于陶瓷、耐火材料、催化剂等领域。其生产工艺以拜耳法为主,具体分为溶出、净化、分解、焙烧、碱回收五大环节。MR30分布式IO配合西门子PLC,运行稳定可靠,助力
    的头像 发表于 09-05 11:30 880次阅读

    MR30分布式IO在喷绘机器人的应用

    喷绘机器人凭借高效、精确、稳定、节能等优点,在汽车、航空航天、电子等多个行业广泛应用。本文以 MR30分布式IO在喷绘机器人中的应用为核心,介绍了喷绘机器人的生产工艺,分析了其在实际应用中的需求痛点
    的头像 发表于 08-15 13:48 890次阅读
    MR30<b class='flag-5'>分布式</b>IO在喷绘机器人的应用

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时数据库、
    的头像 发表于 08-04 11:34 1919次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>效能革命

    明达MR30分布式IO在纺织行业穿经机的应用

    问题,制约着生产效率与产品质量。MR30分布式IO以其分布式部署的灵活性与高效的数据处理能力,为穿经机打造了一张智能神经网,让每一根经纱的穿入都精准可控。​ 穿经机介绍​ 穿经机是纺织厂织造准备车间的关键设备,承担着
    的头像 发表于 08-01 16:27 989次阅读
    明达MR30<b class='flag-5'>分布式</b>IO在纺织行业穿经机的应用

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式
    的头像 发表于 07-14 11:15 1333次阅读

    分布式IO选型指南:2025年分布式无线远程IO品牌及采集控制方案详解

    近年来,随着工业物联网(IIoT)、智能制造和工业4.0的深入发展,分布式无线远程IO模块在工业控制领域的应用愈发广泛。这种模块通过无线方式实现远程数据采集与控制,极大地提高了工业设施的灵活性和效率
    的头像 发表于 06-23 09:48 1581次阅读

    华为分布式存储荣膺2025年Gartner“客户之选”

    近日,全球权威咨询与分析机构Gartner发布《2025年Gartner Peer Insights文件与对象存储平台“客户之声”》报告,华为OceanStor分布式存储再次登顶,连续第四年获得“客户之选”殊荣,彰显全球客户的认
    的头像 发表于 06-07 09:13 1687次阅读