0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当下的HPC存储遇上了哪些挑战

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-03-01 09:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)近两年以来存储市场可谓好不热闹,SSD带来的急速已经体现在了下至消费电子,上至超算的性能上,然而随着高性能计算走上了全新的道路,大吞吐量和大容量也已经不再是HPC存储关注的唯二设计目标了。

那么当下的HPC存储遇上了哪些挑战呢?首先数据生成已经在被数据接入逐渐取代,大数据环境下,IOPS要求的反而是小数据的随机存取。其次,“寻找”到真正所需的数据成了最关键的一环,也对元数据在统计、读取、写入和删除上提出了更高的要求。加之近年来涌现的不同文件与数据形式,处理起来需要额外的注意,高性能存储必须具备大型数据转移的能力。

新的高性能计算场景

就以目前一些在建的智能城市项目为例,诸多传感器和执行器散落在城市中,激光雷达、摄像头、微流控传感器和电机,它们将产生PB级别的原始数据,这些数据在需要经过压缩、预处理、上传、深度学习和推理,存储可以说与边缘计算和机器学习紧密联系在一起。

另一个例子就是我们的自动驾驶,如今的自动驾驶方案都是通过数据与高性能计算实现的,像特斯拉这样的厂商甚至自研自建芯片和超算,用于其自动驾驶技术的开发。自动驾驶测试车队每天都要将PB级的遥测传感数据传输给数据平台,随后经过标签、分类、错误检测和仿真,再放到大型存储系统中,而这样的大型存储平台不仅大小可能扩展至EB级,还要承受着仿真、再处理与机器学习的繁重负载。

在这些新场景给出的挑战下,兴起了一波新的技术,比如PCIe 4.0朝PCIe 5.0转变,光模块从200G朝400G的转变,使用GPU直接存储等专用协议等等。这些技术多数是对HPC存储在吞吐量上的提升,而更重要的是对特定工作流效率的优化。

HPC系统中存储的组成

在当下的HPC场景中,无论是本地部署还是云端环境,都需要一个计算平台,可能是CPU或是CPU+GPU/加速器的配置,这一节点可以充分利用3D Xpoint这样的持久内存,不仅可以提供低延迟的内存数据访问,在断电下不丢失数据,还可以用上DAOS这样分布式异步对象存储的文件系统。

接着是存储平台,也就是并行文件系统的所在,这个系统可能是基于Lustre、Spectrum或是NVMe-oF的方案。但无论是哪种系统,考虑到需要低成本大容量,通常都会用到NVMe硬盘和HDD硬盘的混合方案,但这就提出了数据分布以及数据移动上的挑战。不过现在已经有了PCC/LROC这样的客户端持久性高速缓存,在存储或数据敏感的环境中,只需完成计算平台和存储平台相关的数据移动,进一步降低了I/O开销。

最后是数据的管理,这一部分属于对大量数据更加长期的存储,比如像波音这样的航空公司,需要对每一架飞机的细致数据存储50年以上,还要具备数据追溯的能力。这样的存储并不需要拥有高速的性能,但在前端的程序需要时提供即时的交互,而且为了节能考虑,要做到所谓的“零功耗存储”。

超算是怎么做的?

随着不少超算都已经在布局百亿亿级的系统,作为HPC中最顶端的应用,我们自然可以从中窥得一二,看一看当下主流的HPC存储方案。以计划于今年打造完成的Frontier超算为例,该超算将成为美国第一台百亿亿级别的超算,算力约为1.5 exaFLOPS。

Frontier采取了AMD的全套方案,结合AMD的EPyc CPU和Radeon Instinct GPU,在AMD的缓存一致性互联方案下,CPU上的代码可以直接访问GPU内存,这也就是我们在上文提到的GPU直接存储技术。在存储系统上,Frontier用到了679PB基于Lustre+ZFS的文件系统方案,用47700块硬盘实现,最高速率可达5TB/s。高速存储上,共有5400块NVMe固态硬盘组成11PB的存储空间,提供10TB/s的读取速度。

而Aurora同样作为今年推出的百亿亿级超算系统,则选择了英特尔的方案,单个计算节点由两个Xeon Sapphire Rapids、6个Xe Ponte Vecchio GPU和一个通用内存架构组成。其主要存储方案也选择了英特尔的DAOS文件系统,结合NVMe和傲腾持久内存,组成一套大于230PB的系统,并实现25TB/s的速度。

小结

在HPC存储上的挑战除了以上提到的这些外,还有近来兴起的存内计算激发的计算能力挑战,未来5年内,无论是存储结构、文件系统乃至存储材料都会再度迎来新的变化。这些变化会先一步解决HPC上的难题,再潜移默化地改善日常应用。

原文标题:速度和容量受制?No!高性能存储的瓶颈不止于此

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4886

    浏览量

    90280
  • SSD
    SSD
    +关注

    关注

    21

    文章

    3148

    浏览量

    122598
  • HPC
    HPC
    +关注

    关注

    0

    文章

    350

    浏览量

    25071

原文标题:速度和容量受制?No!高性能存储的瓶颈不止于此

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    HPC系列高性能微控制器:特性、参数与应用解析

    HPC系列高性能微控制器:特性、参数与应用解析 在电子工程领域,高性能微控制器是众多项目的核心组件,它们的性能直接影响着整个系统的运行效率和稳定性。National Semiconductor推出
    的头像 发表于 04-19 10:45 176次阅读

    当 AI 遇上 ICY DOCK 硬盘盒:企业 AI 基础设施的存储革新之道

    在生成式AI的浪潮中,数据已成为新时代的"石油",而存储则成为AI算力的"生命线"。当AI大模型的训练需要海量数据吞吐,当推理侧需要本地化的高速存储,传统存储
    的头像 发表于 03-13 14:54 885次阅读
    当 AI <b class='flag-5'>遇上</b> ICY DOCK 硬盘盒:企业 AI 基础设施的<b class='flag-5'>存储</b>革新之道

    Chiplet,如何助力HPC

    纵横小芯片架构代表了芯片设计和集成方式的根本性变革。随着传统芯片架构在功耗、散热和空间方面逼近物理极限,一种新型架构正在兴起,有望为高性能计算(HPC)开辟一条新的发展道路。这种架构被称为小芯片架构
    的头像 发表于 02-26 15:15 872次阅读
    Chiplet,如何助力<b class='flag-5'>HPC</b>?

    爱普科技扩大S-SiCap™技术应用版图 满足AI与HPC新需求

    全球客制化存储芯片解决方案设计公司爱普科技今日宣布,S-SiCapTM(Stack Silicon Capacitor)产品线持续深化技术布局,聚焦AI服务器与高性能计算(HPC)的整合挑战
    的头像 发表于 12-24 17:53 741次阅读

    东芝企业级硬盘创新技术炼就存储基石

    当企业数据中心的海量需求遇上日益精进的存储技术,一块硬盘的价值早已超越简单的容量数字范畴。今天,与芝迷妹一起聊聊东芝在企业级硬盘采用的关键技术,感受其背后务实而创新的 “技术哲学”。
    的头像 发表于 12-19 14:59 869次阅读

    Amphenol 400POS 0.635MM PITCH COM - HPC 连接器:高性能嵌入式应用新选择

    Amphenol 400POS 0.635MM PITCH COM - HPC 连接器:高性能嵌入式应用新选择 在嵌入式计算机领域,随着应用对性能和带宽的要求不断攀升,高性能计算机模块的标准也在持续
    的头像 发表于 12-11 10:30 690次阅读

    全球前四!京东云云海AI存储跻身IO500高性能存储榜单

    存储技术,云海AI存储不采用 PMEM 硬件,具备更强通用性的同时也实现了更低存储成本。 IO500是全球高性能计算HPC领域最权威、最具影响力的
    的头像 发表于 11-27 14:51 459次阅读
    全球前四!京东云云海AI<b class='flag-5'>存储</b>跻身IO500高性能<b class='flag-5'>存储</b>榜单

    TE Connectivity HPC 350A BESS连接器技术解析与应用指南

    TE Connectivity HPC 350A电池储能系统(BESS) 连接器专注于通过单极350A/1500V大电流连接器提供高安全可靠的解决方案。这些HPC 350A连接器采用一体式成型触点
    的头像 发表于 11-02 17:59 1596次阅读

    新思科技测试IO方案加速HPC和AI芯片量产

    为实现更高性能目标,AI与HPC芯片设计正加速向芯粒架构演进。但是传统单片机SOC已经很难在尺寸上继续扩张,异构集成已成为推动半导体创新的核心动力。然而,它也增加了芯片设计的复杂性,需要更先进的测试
    的头像 发表于 10-15 11:33 881次阅读
    新思科技测试IO方案加速<b class='flag-5'>HPC</b>和AI芯片量产

    【产品介绍】Altair PBS Professional HPC工作负载管理器和作业调度管理系统

    AltairPBSProfessional行业领先的HPC工作负载管理器和作业调度管理系统PBSProfessional是一款快速、强大的工作负载管理器和作业调度管理系统,旨在提高生产力、优化利用率
    的头像 发表于 09-19 17:03 798次阅读
    【产品介绍】Altair PBS Professional <b class='flag-5'>HPC</b>工作负载管理器和作业调度管理系统

    霄云科技银河存储:重构AI时代的存储新范式

    计算(HPC)、生命科学等场景设计的存储系统,以“极速、高可用、全链路可视”为核心,重新定义企业级存储的性能边界。三大核心场景,释放存储潜能1.人工智能模型训练与推
    的头像 发表于 08-21 10:36 1076次阅读
    霄云科技银河<b class='flag-5'>存储</b>:重构AI时代的<b class='flag-5'>存储</b>新范式

    澎峰科技邀您相约CCF HPC China 2025

    第21届CCF全国高性能计算学术年会(CCF HPC China 2025) 将于 2025年8月13日至16日在承载千年风华的历史名城鄂尔多斯盛大举办。
    的头像 发表于 08-07 11:33 1272次阅读

    电磁遇上热与应力-CST多物理场仿真解决复杂工程挑战

    当电磁遇上热与应力,CST MPhysics Studio提供真正的全耦合多物理场仿真能力。电磁-热耦合、热失谐分析、热-机械耦合、电磁-机械耦合,解决复杂工程挑战
    的头像 发表于 07-29 16:21 1095次阅读
    电磁<b class='flag-5'>遇上</b>热与应力-CST多物理场仿真解决复杂工程<b class='flag-5'>挑战</b>

    华芯星重新定义嵌入式存储品质标准

    在物联网设备爆发式增长、工业4.0与汽车智能化加速的当下,嵌入式存储芯片正面临前所未有的性能与可靠性挑战。凭借铠侠(KIOXIA)全球领先的BiCS FLASH 3D闪存技术与SMI(慧荣
    的头像 发表于 07-22 09:11 2670次阅读

    简单认识高带宽存储

    )将多层 DRAM 芯片垂直堆叠,并集成专用控制器逻辑芯片,形成一个紧凑的存储模块。这种架构彻底打破了传统 DDR 内存的平面布局限制,实现了超高带宽、低功耗和小体积高集成度的完美结合,成为支撑 AI、高性能计算(HPC)和高端图形处理的核心
    的头像 发表于 07-18 14:30 5450次阅读