0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

鲲鹏BoostKit 2.0分布式存储全局缓存如何加速数据存储倍数级

7riU_gh_3a181fa 来源:华为计算 作者:华为计算 2021-12-24 10:08 次阅读

在华为全联接2021上,鲲鹏应用使能套件BoostKit(以下简称“鲲鹏BoostKit”)正式升级为2.0,提供 “数据亲和”加速组件,对数据全处理流程进行负载优化,从而大幅提升应用性能。本期由华为计算产品线算法专家陈泽晖和何智文向大家展示鲲鹏BoostKit 2.0分布式存储全局缓存(Global Cache)特性如何做到数据存储和处理的倍数级加速能力。

在摩尔定律的驱使下,计算能力倍数级增长,但数据传输速度过慢导致大量计算资源浪费,也限制了系统性能发挥。例如,在金融行业,银行逐步采用AI技术对客户信息、远程开户录像、客服中心语音、企业资料等数据进行挖掘与利用,对海量文件的读写会占用大量计算资源,导致业务处理效率降低。

原生Ceph IO请求的处理路径长,导致IO时延高,用户数据读写时间长

鲲鹏BoostKit分布式存储全局缓存应运而生,通过缓存前后台分离、IO聚合智能预取三大创新技术实现典型读写场景IOPS提升10倍,IO时延降低90%,意味着同样时间内银行处理的交易笔数提升10倍,而且每笔交易处理时长降低90%!

测试模型:4K IO,7:3混合随机读写;硬件配置:256GB内存,25GE网络,每节点12 * 8TB SATA HDD,2 * 3.2TB NVMe SSD

下面带你1分钟get三大创新技术:

1. 缓存前后台分离——缩短数据处理路径:降低IO请求的线程数量,上层应用只需要将数据写入到缓存池或从缓存池中读取即可响应用户请求。

在数据写入场景,数据到写缓存后就可以给上层应用返回数据写入成功,无需与后台Ceph存储集群等分布式存储软件交互,用户业务应用无感知

2. 智能预取——读加速:将数据提前加载至读缓存,实现80%以上缓存命中率和2倍以上读性能加速。

基于IO数据统计,智能分析IO模型特征,实现缓存命中率大幅提升

3. IO聚合——写加速:技术通过批量数据聚合,实现全周期随机写入转顺序写入,实现满带宽性能。

在缓存中把各种大小的数据块聚合成以8M为单位的大数据块,从随机小IO转变成顺序大IO写入后端Ceph等分布式存储集群

此外,BoostKit全局缓存面向鲲鹏生态,结合硬件特点开展软硬协同优化,如CPU亲和、NUMA亲和等,进一步达到“数据亲和”,在不增加硬件成本的前提下,全局缓存面向全命中和真实业务负载提供2~10倍端到端读写性能加速能力。

原文标题:BoostKit干货店|同样硬件,Ceph存储性能提升10倍

文章出处:【微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    215

    文章

    33619

    浏览量

    247146
  • 数据存储
    +关注

    关注

    5

    文章

    895

    浏览量

    50584
  • ai技术
    +关注

    关注

    1

    文章

    1135

    浏览量

    23705

原文标题:BoostKit干货店|同样硬件,Ceph存储性能提升10倍

文章出处:【微信号:gh_3a181fa836b6,微信公众号:华为计算】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据时代的存储革命:理解分布式存储系统

    管理的效率极低。因此,分布式存储系统应运而生。 分布式存储就是将数据存储在众多的服务器或网络节点
    的头像 发表于 03-07 15:40 145次阅读

    曙光存储推出ParaStor分布式全闪存储

    曙光存储推出ParaStor分布式全闪存储,携业内首创技术XDS,以训练加速、稳定性强、性价比高的独特价值,全维度涵盖网络、计算和平台,为千行百业的AI大模型开发者提供
    发表于 03-01 11:30 227次阅读

    【Vsan数据恢复】Vsan分布式存储虚拟磁盘文件丢失的数据恢复案例

    一套vsan分布式存储架构有数台服务器节点,该vsan分布式存储架构配置了固态硬盘和机械硬盘,固态硬盘作为缓存盘使用,机械硬盘作为容量盘使用
    的头像 发表于 01-03 16:39 275次阅读

    一图读懂《分布式融合存储研究报告(2023)》

    转自:存储产业技术创新战略联盟 2023年11月30日, 存 储产业技术创新战略联盟、中国电子技术标准化研究院联合发布《分布式融合存储研究报告(2023)》,详细阐释分布式融合
    的头像 发表于 12-21 18:05 311次阅读
    一图读懂《<b class='flag-5'>分布式</b>融合<b class='flag-5'>存储</b>研究报告(2023)》

    鸿蒙原生应用开发——分布式数据对象

    ;change\", globalThis.changeCallback) 当同一组网内分布式数据对象发生改变时,同一组网中的所有分布式数据对象同步发生变化,变化后的值为某一
    发表于 12-08 10:01

    redis分布式锁三个方法

    Redis是一种高性能的分布式缓存和键值存储系统,它提供了一种可靠的分布式锁解决方案。在分布式系统中,由于多个节点之间的并发访问,需要使用
    的头像 发表于 12-04 11:22 534次阅读

    分布式数据恢复-hbase+hive分布式存储误删除文件的数据恢复方案

    hbase+hive分布式存储数据恢复环境: 16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置的分布式,上层部署hbase
    的头像 发表于 11-24 15:55 200次阅读

    HarmonyOS分布式文件系统开发指导

    监听、通过软总线建立链路,并根据分布式的设备安全等级执行不同的数据流转策略。 ● hmdfs:实现在内核的网络文件系统,包括缓存管理、文件访问、元数据管理和冲突管理等。 ○
    发表于 11-14 17:14

    高效管理海量数据!忆联 SSD 为分布式存储提供极致性能

    近年来,为满足大规模的存储应用需求,分布式存储成为云环境下存储底座构建的重要选择,相较于传统集中式存储方案的可靠性、安全性以及
    的头像 发表于 10-13 15:55 328次阅读
    高效管理海量<b class='flag-5'>数据</b>!忆联 SSD 为<b class='flag-5'>分布式</b>块<b class='flag-5'>存储</b>提供极致性能

    分布式存储的7个特征

    什么是分布式存储呢?如果一个存储系统,不管是对象、块、文件、kv、log、olap、oltp,只要对所管理的数据做了Partitioning&Replication,不管姿势对不对,其
    发表于 07-18 14:17 696次阅读

    分布式存储架构面临的挑战

      从云和互联网的业务场景来看,其存储域主要采用基于服务器部署分布式存储服务的融合方式,它面临如下挑战 : 1.数据保存周期与服务器更新周期不匹配。大
    的头像 发表于 07-05 10:44 943次阅读
    <b class='flag-5'>分布式</b><b class='flag-5'>存储</b>架构面临的挑战

    过程语言(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 23:00:11

    #分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:58:32

    分布式存储的分类和典型应用场景

    分布式对象存储:指各存储节点由标识符、数据和元数据的对象数据构成。其中标识符在该
    发表于 06-12 14:38 3008次阅读
    <b class='flag-5'>分布式</b><b class='flag-5'>存储</b>的分类和典型应用场景

    如何使用分布式存储系统促进AI模型训练

    这凸显了分布式存储在人工智能(AI)领域的重要性。JuiceFS 是一个开源、高性能的分布式文件系统,为这个问题提供了解决方案。
    发表于 06-12 09:28 348次阅读
    如何使用<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统促进AI模型训练