0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鲲鹏BoostKit 2.0分布式存储全局缓存如何加速数据存储倍数级

7riU_gh_3a181fa 来源:华为计算 作者:华为计算 2021-12-24 10:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在华为全联接2021上,鲲鹏应用使能套件BoostKit(以下简称“鲲鹏BoostKit”)正式升级为2.0,提供 “数据亲和”加速组件,对数据全处理流程进行负载优化,从而大幅提升应用性能。本期由华为计算产品线算法专家陈泽晖和何智文向大家展示鲲鹏BoostKit 2.0分布式存储全局缓存(Global Cache)特性如何做到数据存储和处理的倍数级加速能力。

在摩尔定律的驱使下,计算能力倍数级增长,但数据传输速度过慢导致大量计算资源浪费,也限制了系统性能发挥。例如,在金融行业,银行逐步采用AI技术对客户信息、远程开户录像、客服中心语音、企业资料等数据进行挖掘与利用,对海量文件的读写会占用大量计算资源,导致业务处理效率降低。

原生Ceph IO请求的处理路径长,导致IO时延高,用户数据读写时间长

鲲鹏BoostKit分布式存储全局缓存应运而生,通过缓存前后台分离、IO聚合、智能预取三大创新技术实现典型读写场景IOPS提升10倍,IO时延降低90%,意味着同样时间内银行处理的交易笔数提升10倍,而且每笔交易处理时长降低90%!

测试模型:4K IO,7:3混合随机读写;硬件配置:256GB内存,25GE网络,每节点12 * 8TB SATA HDD,2 * 3.2TB NVMe SSD

下面带你1分钟get三大创新技术:

1. 缓存前后台分离——缩短数据处理路径:降低IO请求的线程数量,上层应用只需要将数据写入到缓存池或从缓存池中读取即可响应用户请求。

在数据写入场景,数据到写缓存后就可以给上层应用返回数据写入成功,无需与后台Ceph存储集群等分布式存储软件交互,用户业务应用无感知

2. 智能预取——读加速:将数据提前加载至读缓存,实现80%以上缓存命中率和2倍以上读性能加速。

基于IO数据统计,智能分析IO模型特征,实现缓存命中率大幅提升

3. IO聚合——写加速:技术通过批量数据聚合,实现全周期随机写入转顺序写入,实现满带宽性能。

在缓存中把各种大小的数据块聚合成以8M为单位的大数据块,从随机小IO转变成顺序大IO写入后端Ceph等分布式存储集群

此外,BoostKit全局缓存面向鲲鹏生态,结合硬件特点开展软硬协同优化,如CPU亲和、NUMA亲和等,进一步达到“数据亲和”,在不增加硬件成本的前提下,全局缓存面向全命中和真实业务负载提供2~10倍端到端读写性能加速能力。

原文标题:BoostKit干货店|同样硬件,Ceph存储性能提升10倍

文章出处:【微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    218

    文章

    35800

    浏览量

    260740
  • 数据存储
    +关注

    关注

    5

    文章

    1014

    浏览量

    52590
  • ai技术
    +关注

    关注

    1

    文章

    1313

    浏览量

    25599

原文标题:BoostKit干货店|同样硬件,Ceph存储性能提升10倍

文章出处:【微信号:gh_3a181fa836b6,微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MR30分布式I/O助力物流分拣系统智能化升级

    本文以MR30分布式I/O在某大型电商物流中心分拣系统的应用为例,详细阐述其在合流、分拣、分流、分运全流程中的模块化应用方案。
    的头像 发表于 10-31 10:58 896次阅读
    MR30<b class='flag-5'>分布式</b>I/O助力物流分拣系统智能化升级

    MR30分布式IO在自动上料机的应用

    。本文结合该企业生产实际,详细阐述自动上料机的生产工艺需求,深入分析MR30分布式IO的应用方式,并通过实际数据验证其应用成效。 本期案例使用的产品:MR30-32DI、MR30-32DO、MR30-16AI-I4W、MR30-TM-2CNT​. 工艺概述​ 本次应用场景
    的头像 发表于 10-30 14:05 135次阅读
    MR30<b class='flag-5'>分布式</b>IO在自动上料机的应用

    一键部署无损网络:EasyRoCE助力分布式存储效能革命

    分布式存储的性能瓶颈往往在于网络。如何构建一个高带宽、超低时延、零丢包的无损网络,是释放分布式存储全部潜力、赋能企业关键业务(如实时数据库、
    的头像 发表于 08-04 11:34 1337次阅读
    一键部署无损网络:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>效能革命

    Ceph分布式存储系统解析

    在当今数据爆炸的时代,企业对存储系统的需求日益增长,传统的集中式存储已经无法满足大规模数据处理的要求。分布式
    的头像 发表于 07-14 11:15 716次阅读

    华为分布式存储荣膺2025年Gartner“客户之选”

    近日,全球权威咨询与分析机构Gartner发布《2025年Gartner Peer Insights文件与对象存储平台“客户之声”》报告,华为OceanStor分布式存储再次登顶,连续第四年获得“客户之选”殊荣,彰显全球客户的认
    的头像 发表于 06-07 09:13 1109次阅读

    曙光存储领跑中国分布式存储市场

    近日,赛迪顾问发布《中国分布式存储市场研究报告(2025)》,指出2024 年中国分布式存储市场首次超过集中式存储,规模达 198.2 亿元
    的头像 发表于 05-19 16:50 1011次阅读

    兆芯+图云创智—可信分布式存储系统解决方案

    图云创智分布式存储系统采用全分布式设计与先进的存储虚拟化技术相结合,由多个独立的兆芯 x86 服务器作为存储节点,联合道熵
    的头像 发表于 04-23 10:29 656次阅读
    兆芯+图云创智—可信<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统解决方案

    分布式存储数据恢复—虚拟机上hbase和hive数据数据恢复案例

    分布式存储数据恢复环境: 16台某品牌R730xd服务器节点,每台服务器节点上有数台虚拟机。 虚拟机上部署Hbase和Hive数据库。
    的头像 发表于 04-17 11:05 514次阅读

    秒杀传统存储!亿万克DM3000分布式存储:EB扩容+协议瞬通

    蛟云SoveCloud DM DM3000系列是亿万克推出的全新一代分布式统一存储产品。该系列用软件定义存储理念替换传统的存储解决方案,助力数据
    的头像 发表于 03-20 09:13 695次阅读
    秒杀传统<b class='flag-5'>存储</b>!亿万克DM3000<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>:EB<b class='flag-5'>级</b>扩容+协议瞬通

    分布式存储和集中式存储有何区别

    存储产品千千万,选来选去怎么办? 戴小编来献妙策,匹配需求不为难!分布式存储和集中式储是存储系统中十重要的两种架构类型,但这两者有何区别?
    的头像 发表于 02-28 10:56 2260次阅读

    分布式存储有哪几种类型?

    分布式存储有哪几种类型?分布式存储系统是一种将数据分散存储在多台独立节点上的技术,根据
    的头像 发表于 02-20 11:00 1125次阅读

    分布式云化数据库有哪些类型

    分布式云化数据库有哪些类型?分布式云化数据库主要类型包括:关系型分布式数据库、非关系型分布式数据
    的头像 发表于 01-15 09:43 879次阅读

    MR30分布式IO在火电厂区的广泛应用

    在火电厂的复杂环境中,实现高效、安全、经济的运行是至关重要的。随着自动化技术的不断发展,分布式IO系统作为一种先进的控制手段,在火电厂区得到了广泛应用。明达技术推出MR30分布式IO模块助力火电厂实现降本增效,绿色发展。
    的头像 发表于 01-06 14:17 698次阅读
    MR30<b class='flag-5'>分布式</b>IO在火电厂区的广泛应用

    HarmonyOS Next 应用元服务开发-分布式数据对象迁移数据权限与基础数据

    提供了async版本供该场景使用。 当前,wantParams中“sessionId”字段在迁移流程中被系统占用,建议开发者在wantParams中定义其他key值存储分布式数据对象生成的id,避免
    发表于 12-24 09:40

    缓存对大数据处理的影响分析

    缓存对大数据处理的影响显著且重要,主要体现在以下几个方面: 一、提高数据访问速度 在大数据环境中,数据
    的头像 发表于 12-18 09:45 1115次阅读