0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

速度和容量受制?No!高性能存储的瓶颈不止于此

E4Life 来源:电子发烧友原创 作者:Leland 2022-02-25 09:40 次阅读
近两年以来存储市场可谓好不热闹,SSD带来的急速已经体现在了下至消费电子,上至超算的性能上,然而随着高性能计算走上了全新的道路,大吞吐量和大容量也已经不再是HPC存储关注的唯二设计目标了。

那么当下的HPC存储遇上了哪些挑战呢?首先数据生成已经在被数据接入逐渐取代,大数据环境下,IOPS要求的反而是小数据的随机存取。其次,“寻找”到真正所需的数据成了最关键的一环,也对元数据在统计、读取、写入和删除上提出了更高的要求。加之近年来涌现的不同文件与数据形式,处理起来需要额外的注意,高性能存储必须具备大型数据转移的能力。

新的高性能计算场景

就以目前一些在建的智能城市项目为例,诸多传感器和执行器散落在城市中,激光雷达、摄像头、微流控传感器和电机,它们将产生PB级别的原始数据,这些数据在需要经过压缩、预处理、上传、深度学习和推理,存储可以说与边缘计算和机器学习紧密联系在一起。

另一个例子就是我们的自动驾驶,如今的自动驾驶方案都是通过数据与高性能计算实现的,像特斯拉这样的厂商甚至自研自建芯片和超算,用于其自动驾驶技术的开发。自动驾驶测试车队每天都要将PB级的遥测传感数据传输给数据平台,随后经过标签、分类、错误检测仿真,再放到大型存储系统中,而这样的大型存储平台不仅大小可能扩展至EB级,还要承受着仿真、再处理与机器学习的繁重负载。

在这些新场景给出的挑战下,兴起了一波新的技术,比如PCIe 4.0朝PCIe 5.0转变,光模块从200G朝400G的转变,使用GPU直接存储等专用协议等等。这些技术多数是对HPC存储在吞吐量上的提升,而更重要的是对特定工作流效率的优化。

HPC系统中存储的组成

在当下的HPC场景中,无论是本地部署还是云端环境,都需要一个计算平台,可能是CPU或是CPU+GPU/加速器的配置,这一节点可以充分利用3D Xpoint这样的持久内存,不仅可以提供低延迟的内存数据访问,在断电下不丢失数据,还可以用上DAOS这样分布式异步对象存储的文件系统。

Lustre文件系统 / Lustre

接着是存储平台,也就是并行文件系统的所在,这个系统可能是基于Lustre、Spectrum或是NVMe-oF的方案。但无论是哪种系统,考虑到需要低成本大容量,通常都会用到NVMe硬盘和HDD硬盘的混合方案,但这就提出了数据分布以及数据移动上的挑战。不过现在已经有了PCC/LROC这样的客户端持久性高速缓存,在存储或数据敏感的环境中,只需完成计算平台和存储平台相关的数据移动,进一步降低了I/O开销。

最后是数据的管理,这一部分属于对大量数据更加长期的存储,比如像波音这样的航空公司,需要对每一架飞机的细致数据存储50年以上,还要具备数据追溯的能力。这样的存储并不需要拥有高速的性能,但在前端的程序需要时提供即时的交互,而且为了节能考虑,要做到所谓的“零功耗存储”。

超算是怎么做的?

随着不少超算都已经在布局百亿亿级的系统,作为HPC中最顶端的应用,我们自然可以从中窥得一二,看一看当下主流的HPC存储方案。以计划于今年打造完成的Frontier超算为例,该超算将成为美国第一台百亿亿级别的超算,算力约为1.5 exaFLOPS。

Frontier超级计算机 / AMD

Frontier采取了AMD的全套方案,结合AMD的EPyc CPU和Radeon Instinct GPU,在AMD的缓存一致性互联方案下,CPU上的代码可以直接访问GPU内存,这也就是我们在上文提到的GPU直接存储技术。在存储系统上,Frontier用到了679PB基于Lustre+ZFS的文件系统方案,用47700块硬盘实现,最高速率可达5TB/s。高速存储上,共有5400块NVMe固态硬盘组成11PB的存储空间,提供10TB/s的读取速度。

Aurora超级计算机 / 英特尔
而Aurora同样作为今年推出的百亿亿级超算系统,则选择了英特尔的方案,单个计算节点由两个Xeon Sapphire Rapids、6个Xe Ponte Vecchio GPU和一个通用内存架构组成。其主要存储方案也选择了英特尔的DAOS文件系统,结合NVMe和傲腾持久内存,组成一套大于230PB的系统,并实现25TB/s的速度。

小结

在HPC存储上的挑战除了以上提到的这些外,还有近来兴起的存内计算激发的计算能力挑战,未来5年内,无论是存储结构、文件系统乃至存储材料都会再度迎来新的变化。这些变化会先一步解决HPC上的难题,再潜移默化地改善日常应用。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    12

    文章

    3863

    浏览量

    84690
  • HPC
    HPC
    +关注

    关注

    0

    文章

    281

    浏览量

    23419
  • 超算
    +关注

    关注

    1

    文章

    109

    浏览量

    8973
收藏 人收藏

    评论

    相关推荐

    SolidWorks2024 不止于此但求优越

    来了怎样的变革和提升?本文将从SolidWorks2024的新特性、应用领域的拓展以及对优越品质的追求三个方面,探讨SolidWorks2024如何不止于此,但求优越。
    的头像 发表于 04-18 13:04 81次阅读
    SolidWorks2024 <b class='flag-5'>不止于此</b>但求优越

    兆芯携手智云创新推出高性能NVMe企业级存储系统

    面向持续增长的数字化转型与应用创新发展需求,兆芯携手智云创新,基于兆芯高性能自主处理器平台成功推出多款信创存储产品,包括高性能NVMe企业级存储系统、HS6000系列企业级
    的头像 发表于 04-12 14:06 147次阅读

    NVMe Host Controller IP实现高性能存储解决方案

    电子发烧友网站提供《NVMe Host Controller IP实现高性能存储解决方案.pdf》资料免费下载
    发表于 02-21 14:28 0次下载

    佰维存储研发突破,为AI高性能计算赋能

    近日,佰维存储在接受调研时透露,公司近期成功研发并发布了支持CXL2.0规范的CXLDRAM内存扩展模块。这款产品具有支持内存容量和带宽扩展、内存池化共享、高带宽、低延迟、高可靠性等优势,特别适合于AI高性能计算的应用。
    的头像 发表于 01-23 16:13 429次阅读

    挑战存储“不可能之三角”:用自研技术引领存储性能突破

    容量高性能、高性价比如何解?
    的头像 发表于 01-03 15:39 250次阅读
    挑战<b class='flag-5'>存储</b>“不可能之三角”:用自研技术引领<b class='flag-5'>存储</b><b class='flag-5'>性能</b>突破

    性能领先|忆联×新华三,打造超融合架构下的高性能存储方案

    为助力企业用户构建超融合架构的现代化数据中心,满足业务发展需求,忆联联合新华三集团在超融合架构下打造高性能存储方案,以此提高数据中心的管理效率和资源利用率。一、背景介绍超融合架构是通过软件定义计算
    的头像 发表于 12-27 18:21 370次阅读
    <b class='flag-5'>性能</b>领先|忆联×新华三,打造超融合架构下的<b class='flag-5'>高性能</b><b class='flag-5'>存储</b>方案

    忆联携手新华三推出高性能存储方案

    为助力企业用户构建超融合架构的现代化数据中心,满足业务发展需求,忆联联合新华三集团在超融合架构下打造高性能存储方案,以此提高数据中心的管理效率和资源利用率。
    的头像 发表于 12-27 18:21 676次阅读
    忆联携手新华三推出<b class='flag-5'>高性能</b><b class='flag-5'>存储</b>方案

    紫光同创FPGA核心板PGL50H|盘古50K核心板,高性能FPGA核心板,应用场景丰富

    盘古50K核心板是基于紫光同创Logos系列(PGL50H-6IFBG484)开发的高性能核心板,具有高数据带宽、高存储容量的特点,适用于高速数据通信、处理、采集等方面的应用。
    发表于 09-06 14:40

    CLOUD4Y加速云存储LSI的高性能解决方案

    电子发烧友网站提供《CLOUD4Y加速云存储LSI的高性能解决方案.pdf》资料免费下载
    发表于 08-23 10:35 0次下载
    CLOUD4Y加速云<b class='flag-5'>存储</b>LSI的<b class='flag-5'>高性能</b>解决方案

    12gb/s SAS:破除存储性能瓶颈

    电子发烧友网站提供《12gb/s SAS:破除存储性能瓶颈.pdf》资料免费下载
    发表于 08-14 10:01 0次下载
    12gb/s SAS:破除<b class='flag-5'>存储</b><b class='flag-5'>性能</b><b class='flag-5'>瓶颈</b>

    三星展示两项可能突破存储墙限制的解决方案

    呈几何级数增加,但存储性能在带宽、容量、延迟以及电力这四个方面都难以赶上cpu的发展速度,成为计算速度
    的头像 发表于 07-17 09:59 242次阅读

    如何确定合适的存储系统 存储的关键瓶颈是什么

    机器学习需要组织处理大量数据,而且数据量越大,模型的准确性相对也越高,这意味着企业每天必须收集和存储越来越多的数据。而当存储无法扩展时,数据密集型工作负载会产生瓶颈,这会限制性能并导致
    发表于 06-15 17:24 151次阅读
    如何确定合适的<b class='flag-5'>存储</b>系统 <b class='flag-5'>存储</b>的关键<b class='flag-5'>瓶颈</b>是什么

    STM 32“不止于芯”,ST在数字电源领域的“定制化”设计

    程度和抗干扰能力,近年来在各大领域得到了广泛的应用。   在本月举办的“STM 32不止于芯”第六届STM32中国峰会上,意法半导体中国区通用微型控制器市场部门韩旭同,就数字电源领域的相关应用、问题,展开了关于“STM32构建数字
    的头像 发表于 05-26 15:34 2322次阅读
    STM 32“<b class='flag-5'>不止于</b>芯”,ST在数字电源领域的“定制化”设计

    “STM32 不止于芯”—力源信息精彩亮相第六届STM32中国峰会

    2023年STM32中国峰会暨粉丝狂欢节在深圳完美收官!作为国内最重量级的MCU行业盛宴,本届峰会为期两天,以“STM32不止于芯”为主题,通过高端主题论坛、分论坛及技术研讨会、前沿技术展示、粉丝
    的头像 发表于 05-19 10:44 532次阅读
    “STM32 <b class='flag-5'>不止于</b>芯”—力源信息精彩亮相第六届STM32中国峰会

    STM32中国峰会暨粉丝狂欢节开启 “STM32不止于芯”

    5月12-13日, STM32峰会重磅回归科技之都深圳! STM32中国峰会是展示STM32产品技术和解决方案的行业盛会,2023年,我们迎来了第六届STM32中国峰会。本届峰会以“STM32不止于
    发表于 05-13 17:32 509次阅读
    STM32中国峰会暨粉丝狂欢节开启 “STM32<b class='flag-5'>不止于</b>芯”