0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

速度和容量受制?No!高性能存储的瓶颈不止于此

E4Life 来源:电子发烧友原创 作者:Leland 2022-02-25 09:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近两年以来存储市场可谓好不热闹,SSD带来的急速已经体现在了下至消费电子,上至超算的性能上,然而随着高性能计算走上了全新的道路,大吞吐量和大容量也已经不再是HPC存储关注的唯二设计目标了。

那么当下的HPC存储遇上了哪些挑战呢?首先数据生成已经在被数据接入逐渐取代,大数据环境下,IOPS要求的反而是小数据的随机存取。其次,“寻找”到真正所需的数据成了最关键的一环,也对元数据在统计、读取、写入和删除上提出了更高的要求。加之近年来涌现的不同文件与数据形式,处理起来需要额外的注意,高性能存储必须具备大型数据转移的能力。

新的高性能计算场景

就以目前一些在建的智能城市项目为例,诸多传感器和执行器散落在城市中,激光雷达、摄像头、微流控传感器和电机,它们将产生PB级别的原始数据,这些数据在需要经过压缩、预处理、上传、深度学习和推理,存储可以说与边缘计算和机器学习紧密联系在一起。

另一个例子就是我们的自动驾驶,如今的自动驾驶方案都是通过数据与高性能计算实现的,像特斯拉这样的厂商甚至自研自建芯片和超算,用于其自动驾驶技术的开发。自动驾驶测试车队每天都要将PB级的遥测传感数据传输给数据平台,随后经过标签、分类、错误检测和仿真,再放到大型存储系统中,而这样的大型存储平台不仅大小可能扩展至EB级,还要承受着仿真、再处理与机器学习的繁重负载。

在这些新场景给出的挑战下,兴起了一波新的技术,比如PCIe 4.0朝PCIe 5.0转变,光模块从200G朝400G的转变,使用GPU直接存储等专用协议等等。这些技术多数是对HPC存储在吞吐量上的提升,而更重要的是对特定工作流效率的优化。

HPC系统中存储的组成

在当下的HPC场景中,无论是本地部署还是云端环境,都需要一个计算平台,可能是CPU或是CPU+GPU/加速器的配置,这一节点可以充分利用3D Xpoint这样的持久内存,不仅可以提供低延迟的内存数据访问,在断电下不丢失数据,还可以用上DAOS这样分布式异步对象存储的文件系统。

Lustre文件系统 / Lustre

接着是存储平台,也就是并行文件系统的所在,这个系统可能是基于Lustre、Spectrum或是NVMe-oF的方案。但无论是哪种系统,考虑到需要低成本大容量,通常都会用到NVMe硬盘和HDD硬盘的混合方案,但这就提出了数据分布以及数据移动上的挑战。不过现在已经有了PCC/LROC这样的客户端持久性高速缓存,在存储或数据敏感的环境中,只需完成计算平台和存储平台相关的数据移动,进一步降低了I/O开销。

最后是数据的管理,这一部分属于对大量数据更加长期的存储,比如像波音这样的航空公司,需要对每一架飞机的细致数据存储50年以上,还要具备数据追溯的能力。这样的存储并不需要拥有高速的性能,但在前端的程序需要时提供即时的交互,而且为了节能考虑,要做到所谓的“零功耗存储”。

超算是怎么做的?

随着不少超算都已经在布局百亿亿级的系统,作为HPC中最顶端的应用,我们自然可以从中窥得一二,看一看当下主流的HPC存储方案。以计划于今年打造完成的Frontier超算为例,该超算将成为美国第一台百亿亿级别的超算,算力约为1.5 exaFLOPS。

Frontier超级计算机 / AMD

Frontier采取了AMD的全套方案,结合AMD的EPyc CPU和Radeon Instinct GPU,在AMD的缓存一致性互联方案下,CPU上的代码可以直接访问GPU内存,这也就是我们在上文提到的GPU直接存储技术。在存储系统上,Frontier用到了679PB基于Lustre+ZFS的文件系统方案,用47700块硬盘实现,最高速率可达5TB/s。高速存储上,共有5400块NVMe固态硬盘组成11PB的存储空间,提供10TB/s的读取速度。

Aurora超级计算机 / 英特尔
而Aurora同样作为今年推出的百亿亿级超算系统,则选择了英特尔的方案,单个计算节点由两个Xeon Sapphire Rapids、6个Xe Ponte Vecchio GPU和一个通用内存架构组成。其主要存储方案也选择了英特尔的DAOS文件系统,结合NVMe和傲腾持久内存,组成一套大于230PB的系统,并实现25TB/s的速度。

小结

在HPC存储上的挑战除了以上提到的这些外,还有近来兴起的存内计算激发的计算能力挑战,未来5年内,无论是存储结构、文件系统乃至存储材料都会再度迎来新的变化。这些变化会先一步解决HPC上的难题,再潜移默化地改善日常应用。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4693

    浏览量

    89569
  • HPC
    HPC
    +关注

    关注

    0

    文章

    342

    浏览量

    24825
  • 超算
    +关注

    关注

    1

    文章

    118

    浏览量

    9499
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    当AI运行遭遇存储瓶颈:一个专业硬盘盒如何让性能提升40%?

    在AI项目的整个生命周期中,数据存储的效能直接决定了工作流的顺畅程度。面对海量的训练集和频繁的模型迭代,普通存储设备往往在速度、散热与扩展性上力不从心,成为隐形的性能
    的头像 发表于 11-28 15:29 308次阅读
    当AI运行遭遇<b class='flag-5'>存储</b><b class='flag-5'>瓶颈</b>:一个专业硬盘盒如何让<b class='flag-5'>性能</b>提升40%?

    全球前四!京东云云海AI存储跻身IO500高性能存储榜单

    存储技术,云海AI存储不采用 PMEM 硬件,具备更强通用性的同时也实现了更低存储成本。 IO500是全球高性能计算HPC领域最权威、最具影响力的
    的头像 发表于 11-27 14:51 203次阅读
    全球前四!京东云云海AI<b class='flag-5'>存储</b>跻身IO500<b class='flag-5'>高性能</b><b class='flag-5'>存储</b>榜单

    武汉芯源小容量存储芯片EEPROM产品的特点

    和读取,适用于需要长期保存关键数据的设备。 多种存储容量:武汉芯源半导体的EEPROM产品提供多种存储容量选择,从2KB到512KB不等,以满足不同应用的需求。 先进的工艺:采用华虹95nm最先进工艺制造
    发表于 11-21 07:10

    推荐高性能存储psram芯片

    智能穿戴、物联网设备和端侧AI应用快速发展,PSRAM伪静态随机存储器,正成为越来越多嵌入式系统的优选方案,如何选择一个高性能、小尺寸与低功耗的psram芯片是一个值得思考的问题。由EMI自主研发
    的头像 发表于 11-18 17:24 124次阅读

    不止于4层!华秋PCB 6层板爆款重磅上线

    4层之后,再看6层上月,华秋PCB推出了4层板爆款,以“真香”价格引爆市场。今天,华秋PCB怀着更大的诚意,为您带来承诺中的下一站——「华秋PCB6层板爆款」正式登场!不止于降价,我们重新定义6层板
    的头像 发表于 11-12 07:33 197次阅读
    <b class='flag-5'>不止于</b>4层!华秋PCB 6层板爆款重磅上线

    华纳云为游戏数据库选择高性能NVMe SSD存储

    游戏数据库对速度、可靠性和可扩展性有极高要求。随着在线游戏的发展,开发者越来越依赖NVMe SSD存储来提供服务器租用和服务器托管解决方案。本文将指导您了解为游戏数据库选择高性能NVMe SSD
    的头像 发表于 09-30 16:03 826次阅读

    RF SoC技术构建高性能雷达信号收发系统丨应对多通道、高速度与同步挑战

    RF SoC技术构建高性能雷达信号收发系统|应对多通道、高速度与同步挑战 高性能雷达信号收发系统集成了 高速信号采集、同步发射、大容量数据存储
    的头像 发表于 09-23 14:48 498次阅读
    RF SoC技术构建<b class='flag-5'>高性能</b>雷达信号收发系统丨应对多通道、高<b class='flag-5'>速度</b>与同步挑战

    曙光存储支持西湖大学高性能计算中心部署完成全新存储系统

    近日,曙光存储支持西湖大学高性能计算中心部署完成全新存储系统,为AI研发、科学计算和信息化平台等提供存力支持。性能实测显示,该系统单节点带宽可达150GB/s,是国际友商的近4倍,充分
    的头像 发表于 08-25 11:48 949次阅读

    高性能存储控制器的技术解析

    SSD2351芯片:高性能存储控制器的技术解析**   SSD2351是一款由行业领先厂商推出的高性能固态硬盘(SSD)主控芯片,专为满足现代数据中心、企业存储
    的头像 发表于 07-15 14:50 405次阅读

    半导体存储芯片核心解析

    (FTL,磨损均衡,纠错等),存在读写干扰问题。 结构演进: 平面 NAND:传统二维结构,工艺微缩遇到瓶颈。 3D NAND:将存储单元垂直堆叠(几十层到几百层),突破密度限制,降低成本,提高性能
    发表于 06-24 09:09

    TurMass™:高性能全国产无线物联网技术解析,突破 LPWAN 瓶颈

    TurMass™ 技术凭借其在大规模多天线技术、高性能调制技术、高效时隙双工、大容量多址接入、低功耗设计以及强大的抗干扰能力等多方面的卓越表现,为窄带无线传输领域带来了革命性的变革。
    的头像 发表于 06-13 14:08 1903次阅读
    TurMass™:<b class='flag-5'>高性能</b>全国产无线物联网技术解析,突破 LPWAN <b class='flag-5'>瓶颈</b>

    西部数据推出大容量存储方案,赋能NAS用户、创意专业人士与内容创作者

    了更高的要求。随着当今数据驱动的需求不断增长,西部数据公司(NASDAQ: WDC)推出了一系列全新升级的产品,旨在满足市场对大容量存储解决方案的迫切需求。 大容量高性能的HDD赋能
    发表于 03-12 16:16 445次阅读

    不止高性能!贞光科技代理紫光国芯全系列存储产品,为您提供定制化DDR解决方案!

    在数据爆炸的时代,贞光科技代理紫光国芯全系列存储产品,以“不止高性能”为核心,为各行业量身打造内存解决方案。从工业自动化到AI算力革命,重新定义存储技术的边界!
    的头像 发表于 03-03 17:01 646次阅读
    <b class='flag-5'>不止</b><b class='flag-5'>高性能</b>!贞光科技代理紫光国芯全系列<b class='flag-5'>存储</b>产品,为您提供定制化DDR解决方案!

    容量高性能存储是数据中心存储的主流需求

    采访前言 随着AI大模型的迅速发展,各种行业及应用产生了海量的数据,这不仅要求存储设备具备大容量高性能,还要有更高的可靠性和稳定性。在第十九届中国IDC产业年度大典,东芝电子元件(上海)有限公司
    的头像 发表于 01-23 09:37 1017次阅读

    EMMC存储如何影响设备性能

    基于NAND闪存的存储技术,它集成了控制器和NAND闪存在一个单一的封装中。与传统的SD卡或eMMC相比,EMMC提供了更高的数据传输速率和更低的功耗。EMMC的版本从4.41到5.1不等,每个版本都有不同的性能和特性。 1. 读写速度
    的头像 发表于 12-25 09:40 2996次阅读