0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

纠删码技术为产业转型升级构筑数据护盾

浪潮存储 来源:浪潮存储 作者:浪潮存储 2022-06-16 09:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

百万猎人兵临城下,向魔法护盾发起猛烈冲击,却无法将拥有99级神力的护盾撼动分毫。

这是科幻电影《头号玩家》里的一幕。电影里,不仅“绿洲”被视为元宇宙未来理想形态,“魔法护盾”也迅速跨界出圈,在企业数据管理领域引发关注。这是因为随着数字经济快速发展,数据要素在受到企业重视的同时,全球超80%的IT决策者认为现有数据保护方案无法满足未来业务挑战,保护好数据资产成为企业的当务之急。

日前,在由存储产业技术创新联盟主办的“元宇宙存储研究与实践”开放计算技术沙龙上,来自中科大、华中大、郑州大学、建信金科以及浪潮存储的“产学研用”各界专家汇聚一堂,在关注元宇宙存储发展的同时,还共同就纠删码优化、细粒度感知等数据保护话题展开讨论。本次沙龙是场景共同体战略的承袭和实践,浪潮信息存储产品线总经理李辉曾提出,面向层出不穷的新应用、新场景,携手产业链伙伴推进“平台+生态”战略,以六种模式加速企业数字转型。

数据保护

悬在头顶的达摩克里斯之剑

数字虚拟人需要收集的高达百倍甚至千倍的数据、VR头显从4K升级到视网膜级需提升10倍数据传输量、飞行模拟器采集的数据量超2PB。

以元宇宙为代表的新应用带来数据规模十倍、百倍激增,快速增长的多模态数据增加了企业数据保护的难度。数据显示,企业现在管理的数据量是五年前的十倍以上,全球82%、中国88%的IT决策者担心现有数据保护方案无法满足未来业务挑战。

这些担忧源自企业的现实困境,根据对全球1000名决策者的调研,全球30%的受访者在过去一年中经历过数据丢失,45%遭遇过计划外的系统停机。另据IDC统计,在过去12个月,全球超过三分之一的组织遭遇过勒索软件攻击或入侵,导致系统或数据无法访问。数据保护,已然成为摆在企业数字化转型面前的一大挑战。本次沙龙,中国科学技术大学许胤龙教授以及浪潮存储技术专家共同给出了答案。

数据容错

业界两种技术流派之争

“数据容错,业界通常有两种办法,一种是多副本,另一种是纠删码”,许胤龙教授表示。多副本访问性能高、故障修复快,但存储开销比较大(烧钱、占地),令企业直呼吃不消;纠删码开销小(花小钱、办大事),一般存储空间比RAID 1镜像小,在数据爆炸式增长的趋势下更受市场欢迎,企业用脚投票纷纷选择了纠删码。

d78f7c4c-ed08-11ec-ba43-dac502259ad0.png

△三副本和纠删码对比

时下人气攀升的纠删码,究竟是什么呢?所谓纠删码(Erasure Coding),是一种数据保护方法,它将数据分割成片段,把冗余数据块扩展、编码,并将其存储在不同位置,比如硬盘、存储节点或其他物理位置。

“纠删码,可以简单理解成对原始数据做线性组合”,许胤龙教授表示。比如 (2+2)纠删码,就是A、B两个数据可以做A+B和A+2B的线性组合,能容任意两个节点错,当恢复数据的时候直接解方程就行。一般情况下,业界常用的是(k,m)-MDS码,把k个数据编码成m个校验数据,k+m个数据块形成一个条带,最多可以容许m个块同时故障。工业界常见的m一般是2或3,数据规模较大的话,可以把m设为4~6。

纠删码

跑得如丝般顺滑并非易事

纠删码“花小钱、办大事”的优势虽然非常明显,但要在超大规模数据中心内或者是跨数据中心使用纠删码做数据保护,却需要过五关闯六将,绝非易事。

第一关

同一数据中心内,数据恢复的网络传输时间占比超90%,纠删码“龟速”难题如何破。

纠删码能够降低存储成本、提高容错能力,但纠删码最大的问题是在数据丢失之后,数据恢复过程需要从其他地方读取大量数据,故障修复堪称龟速。通过对纠删码“从存活节点读取数据、传输、在备份节点解码、传输、在替代节点写入”的整个流程做分析,发现网络传输占整个数据恢复时间的比例超90%,如何优化数据恢复时间呢?

首先,数据分批恢复。在实际系统里面,数据块是随机的分布到不同的节点里,随机数据分布从统计概率的角度来说,是能达到负载均衡的。但一般来说,在系统实现的时候,一般来说因为系统IO、内存、CPU资源也有限,同时系统还要支撑前台的应用综合各方面,所以修复一般都会是分批进行。“我们做过实验,分批比不分批大概要快15%左右”,许教授表示。

d7bcf51e-ed08-11ec-ba43-dac502259ad0.png

△清华、港中大、普渡、中科大纷纷开展纠删码优化研究

其次,可以利用二部图和网络流图的办法,使得从不同的节点上进行恢复的时候,不同节点上读数据量是均衡的,写数据量也是均衡的,并且每一个节点承担的恢复任务也是均衡的。清华、港中大、普渡、中科大等顶级高校均对纠删码技术进行了研究,经过优化中科大SelectiveEC技术能够在90%以上的情况下都实现负载均衡,相比HDFS大约50%的负载均衡水平,中科大的负载均衡水平能高出70%以上,恢复速度提升30%以上。同时Selective EC比HDFS有更少的毛刺、更短的长尾、更短的任务生命周期。

d7f71262-ed08-11ec-ba43-dac502259ad0.png

△纠删码优化结果

“我们很认同许教授的观点,为了实现数据纠删的负载均衡,浪潮存储一直在技术上不断打磨和创新”,浪潮信息分布式存储架构师张立强表示。

浪潮分布式存储AS13000突破软硬件协同宽条带纠删技术,融合多元算力,解决数据高冗余比纠删的计算性能、资源消耗、容量、可靠性等指标难以兼顾的问题。举个例子,浪潮存储创新研制了纠删码FPGA加速卡,设计可重构最小硬件逻辑单元,实现编解码复用、全纠删比支持,实现宽条带纠删的CPU计算卸载。在32+6纠删比配置下,浪潮存储能够将处理器平台的CPU占用率降低90%,性能提升390%,这就如同将汽车行驶的速度提升到了复兴号的水平。其实浪潮分布式存储在高校领域应用广泛,目前已经在中科大、清华、北大、复旦、浙大、中山大学等国内顶级高校实现规模化部署,支撑科研智慧应用平台稳定运行,以数据之力助力科研取得丰硕成果。

第二关

跨数据中心场景,数据中心带宽极其有限,如何“跨越万水千山”做纠删。

考虑到地震、山洪、火灾等灾害因素影响,大型企业往往会跨数据中心做数据保护。所谓跨数据中心,是指多个数据中心可能建在距离城区比较远的地方或者是不同的城区的地方,这时候跨数据中心的带宽就会很宝贵,通常跟数据中心内部的带宽相比,跨数据中心带宽只有1/20。

d820cbfc-ed08-11ec-ba43-dac502259ad0.png

△跨数据中心带宽约为数据中心内带宽的1/20

RS码部署方式在同一数据中心内做纠删是有优势的,但在跨数据中心环境下却面临挑战。这是因为RS码是把一个条带的数据均匀分布到不同数据中心去。假如现在有15个数据块,把它编码成12个校验块,分散在三个数据中心,这时候只能容单个数据中心故障,存储开销大概是180%,如果出现单块故障,需要跨数据中心访问7个数据块,需要的带宽开销比较多。

新型LRC(Locally Repairable Code)分组编码方式,可以在存储开销和恢复性能之间做一个权衡。LRC(k,l,g)分组编码有三个值,k表示数据块,l代表局部校验块,g是全局校验块。LRC分组编码通过读取局部数据块,减少重构所需的数据量,从而提升数据修复性能。这就好比618购物,北京小伙买一箱牛奶,如何用最快的速度把货物送到顾客手里呢,电商平台会找到距离顾客比较近的天津或河北仓库(类似l局部校验块)进行配送,尽量减少从西安或广州(类似g全局校验块)调货的概率。

d8540364-ed08-11ec-ba43-dac502259ad0.png

△LRC分组编码技术优化结果

按照新型部署方式,“在实际集群里面,我们实现了数据传输、数据解码的优化,大概能把速度提升30%”,许胤龙教授表示。

“浪潮一直将可靠性视为存储的生命线,在异地数据保护方面做了诸多创新”,浪潮信息存储研发部何营表示。

浪潮存储不仅基于一套存储架构承载块、文件、对象、大数据等多种数据服务,在WAN加速、快速重构、透明故障切换等高级功能方面持续创新。以WAN广域网加速技术为例,浪潮存储通过数据流压缩、固定块切割和多数据流并发,将远程传输性能提升高达10倍、延时降低10倍,帮助海量数据异地迁徙和灾备。

小结

伴随元宇宙、AI、大数据新技术、新应用不断涌现,数字经济正在成为中国经济发展的关键因素。数据显示,从2020年到2025年数字经济核心产业增加值将从7.9万亿提升至13万亿,是驱动GDP增长的引擎。

“浪潮存储是整体市场全球前四、分布式存储销量中国第一的存储厂商,纠删码技术在浪潮大部分分布式存储客户中得到应用,为产业转型升级构筑了数据护盾”,浪潮信息首席架构师叶毓睿表示。未来浪潮存储将携手产学研用各方力量,共建场景共同体驱动社会高质量发展。

原文标题:元宇宙存储:如何为ZB级数据打造魔法护盾

文章出处:【微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4698

    浏览量

    89581
  • 浪潮
    +关注

    关注

    1

    文章

    476

    浏览量

    25309
  • 纠删码
    +关注

    关注

    0

    文章

    5

    浏览量

    5006

原文标题:元宇宙存储:如何为ZB级数据打造魔法护盾

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    远景达固定式扫器、二维设备有哪些行业应用

    在物联网技术加速渗透的今天,固定式扫器、二维设备已成为各行业数字化转型的“刚需装备”。作为深耕物联网自动识别领域二十五余载的高新
    的头像 发表于 11-05 15:27 112次阅读
    远景达固定式扫<b class='flag-5'>码</b>器、二维<b class='flag-5'>码</b>扫<b class='flag-5'>码</b>设备有哪些行业应用

    智能电网局放在线监测系统:构筑电网安全的“数字

    。智能电网局放在线监测系统通过多维度技术融合,实现了从“被动抢修”到“主动预防”的运维模式升级技术内核:多物理场协同感知与智能解析该系统以暂态地电压检测核心,
    的头像 发表于 10-28 09:05 171次阅读
    智能电网局放在线监测系统:<b class='flag-5'>构筑</b>电网安全的“数字<b class='flag-5'>护</b><b class='flag-5'>盾</b>”

    飞腾一体机主板工业转型升级和高质量发展注入强大动力

    在工业4.0加速渗透的今天,一片小小的主板正成为产业升级的关键支点。广州高能计算机基于飞腾推出的一系列一体机主板,以自主架构筑技术底座,用全能性能适配多元场景,
    的头像 发表于 09-29 17:33 508次阅读

    领导调研|刘非在临平区调研传统产业转型升级:全面推进科技创新和产业创新深度融合 加快传统产业高端化

    刘非在临平区调研传统产业转型升级时强调全面推进科技创新和产业创新深度融合加快传统产业高端化智能化绿色化发展22日,省委常委、市委书记刘非在临
    的头像 发表于 08-23 10:13 836次阅读
    领导调研|刘非在临平区调研传统<b class='flag-5'>产业</b><b class='flag-5'>转型</b><b class='flag-5'>升级</b>:全面推进科技创新和<b class='flag-5'>产业</b>创新深度融合 加快传统<b class='flag-5'>产业</b>高端化

    多雷区雷电预警系统:守护安全的科技

    多雷区雷电预警系统:守护安全的科技 柏峰【BF-LD】在多雷区,雷电灾害频发,严重威胁着人们的生命财产安全以及各类基础设施的稳定运行。为了有效应对这一自然威胁,多雷区雷电预警系统应运而生,它宛如一位不知疲倦的卫士,借助先进技术
    的头像 发表于 08-13 11:37 571次阅读
    多雷区雷电预警系统:守护安全的科技<b class='flag-5'>护</b><b class='flag-5'>盾</b>

    微软Microsoft Edge浏览器构筑立体式安全防线

    在信息爆炸的今天,钓鱼网站、诈骗广告、隐私追踪层出不穷。Microsoft Edge 浏览器桌面与移动端用户构筑了立体式安全防线。用七大安全,保护你的上网安全。
    的头像 发表于 08-04 15:39 1020次阅读

    传感产业链即将全面集聚,持续推动转型升级

    美元,2025年将达到340.7亿美元,传感器正在世界范围内,产业转型升级不断提振活力。 机遇勃发,传感器产业链,也即将迎来新一轮集会。
    的头像 发表于 07-27 22:01 916次阅读
    传感<b class='flag-5'>产业</b>链即将全面集聚,持续推动<b class='flag-5'>转型</b><b class='flag-5'>升级</b>

    时代以AI战略赋能全线产品智能化升级

    ChatGPT掀起的智能革命席卷全球,DeepSeek等大模型持续刷新性能边界,人工智能从实验走向产业深处,成为重塑经济格局、重构安全范式的核心力量。从国家战略到企业实践,从技术突破到场景落地,智能化浪潮以前所未有的速度推动着社会变革。芯
    的头像 发表于 07-14 15:47 1364次阅读

    嵌入式二维器的几大实用场景及解决方案

    在数字化转型浪潮中,嵌入式二维器作为连接物理世界与数字系统的核心组件,正以高集成度、低功耗和场景适配性的优势,重构各行业的效率逻辑。以下结合典型应用场景与技术方案,解析其如何推动
    的头像 发表于 07-01 14:21 645次阅读
    嵌入式二维<b class='flag-5'>码</b>扫<b class='flag-5'>码</b>器的几大实用场景及解决方案

    「案例分享」华助力亦庄视听产业园:打造智慧园区管理新模式

    「案例分享」华助力亦庄视听产业园:打造智慧园区管理新模式
    的头像 发表于 06-10 08:56 551次阅读
    「案例分享」<b class='flag-5'>盾</b>华助力亦庄视听<b class='flag-5'>产业</b>园:打造智慧园区管理新模式

    时代入选嘶吼2025网络安全产业图谱

    近日,嘶吼安全产业研究院正式发布了《嘶吼2025网络安全产业图谱》。芯时代作为领先的零信任业务安全代表厂商,实力入选零信任、身份访问管理(IAM)、特权账号管理、密码安全、API安全、数据
    的头像 发表于 05-30 15:18 932次阅读

    智慧路灯网络安全监测:城市安全运行的隐形

    能动摇城市安全运行的根基。此时,智慧路灯网络安全监测体系如同一张隐形,以全时全域的防护能力,城市数字生态构筑起看不见却不可或缺的安全屏障。 智慧路灯:城市安全的 "神经节点" 与
    的头像 发表于 05-28 22:29 456次阅读
    智慧路灯网络安全监测:城市安全运行的隐形<b class='flag-5'>护</b><b class='flag-5'>盾</b>

    时代中标易事特集团统一身份认证管理项目

    时代中标易事特集团统一身份认证管理项目,助力集团在信息化数字化管理领域再迈关键一步。芯时代基于零信任安全理念,客户建设统一化、标准化、自动化的身份管理体系,提升IT管理能力、办公和运维效率等,
    的头像 发表于 05-09 11:08 1029次阅读

    时代设备指纹技术全新升级

    在数字经济高速发展的今天,黑灰产攻击如影随形,个人隐私泄露、金融欺诈、电商刷单等风险事件频发。芯时代 “觅迹” 设备指纹全新升级,以跨渠道识别能力打破行业壁垒,金融、电商、游戏等多场景构筑
    的头像 发表于 05-07 16:23 975次阅读

    基调听云荣膺数字安全护航计划优秀企业,斩获“磐安”双项大奖助力产业升级

    新场景下的网络安全挑战,以数字安全为坚实,助力产业高速发展。中国信通院总工程师魏然、中国信通院泰尔终端实验室主任马鑫及各优秀企业代表汇聚一堂,共同分享数字安全
    的头像 发表于 12-30 11:45 571次阅读
    基调听云荣膺数字安全护航计划优秀企业,斩获“磐安”双项大奖助力<b class='flag-5'>产业</b><b class='flag-5'>升级</b>