0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC集群的三个关键系统

易飞扬通信 来源:易飞扬通信 2023-06-17 11:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

数据中心自1940年代就已存在,第一批计算机专用数据室被用于军事目的。随着计算和存储需求在此后的几十年里呈指数级增长,应用扩展到生活的各个领域,组织越来越多地寻求专用数据中心来容纳他们的基础设施。

为了降低成本并在竞争中脱颖而出,自HPC出现以来,外包数据中心基础设施几乎已成为必需。HPC是一种功能强大但在密度、热量和带宽方面要求很高的解决方案。这些数据中心需要解决许多高性能计算机同时运行所需的热量和功率密度所带来的挑战。

哪些行业使用高性能计算?

由于HPC可以以更快的速度将数据分析和人工智能结合在一起,因此不出所料,采用HPC数据中心的顶级公司都在云计算和IT行业中。但其他行业的公司也可以利用HPC的力量。

这可能包括:

研究实验室

金融科技

天气预报

媒体和娱乐

卫生保健

政府和国防

支持HPC的数据中心可以满足客户对快速网络不断增长的需求,同时跟上日益数字化的格局。

HPC的三个关键系统

要构建适应HPC的基础架构,了解HPC集群的三个关键系统非常重要:计算、存储和网络。

计算

高效的HPC系统需要一组计算机服务和软件程序,它们协同工作以运行算法程序。每个模块都需要与集群中的其他模块保持同步;否则,整个HPC系统将变得过时。

HPC的目标是执行高速计算,这需要聚合来自不同硬件类型的计算机能力。数据中心拥有足够的空间和能力来容纳支持HPC操作所需的计算机系统和硬件,仅HPC计算就需要大多数企业无法处理的电源和冷却协调。

存储

为了容纳HPC处理的海量数据,其存储系统应尽可能频繁地从CPU卸载,而不中断计算操作。根据Weka的说法,HPC存储系统需要满足以下这些需求:

任何节点的数据随时可用

可用数据必须是最新的

可以处理任何大小的数据请求

支持面向性能的协议

使用最新的存储技术(例如SSD

扩展到毫秒以跟上恒定的延迟

网络

HPC网络的拓扑结构与您的办公室内部网非常不同。除了CPU和存储之间的持续数据传输的极端要求外,构成HPC环境的许多不同的计算组件被视为一台计算机,由“结构”组合在一起。“HPC结构的关键概念是拥有大量可扩展带宽(贯穿),同时保持超低延迟。”

降温设施

鉴于HPC基础设施的密度和产生的热量,冷却可能是一项重大挑战。现代数据中心使用的传统热通道遏制系统可以有效地冷却当今的50kW HPC机架。展望未来,HPC集群可能会增加密度并刺激数据中心实施更普遍可用的液体冷却。根据研发机构国家可再生能源实验室的说法,液体冷却可以提供比空气冷却高1,000倍的冷却能力,而且物理占地面积更小。浸没式液冷数据中心部署灵活性更高,且面向未来的客户。

以易飞扬创新性的液冷互连光模块和互连解决方案为例。其中液冷高速模块可在1米深的氟化液和矿物油中稳定运行(已通过客户的长期认证),相比传统制冷方案,具备更高的散热效率和更低的能耗,可将高性能计算的算力提升到一个新的水平。

92151d46-0c4e-11ee-962d-dac502259ad0.png

高性能组件

HPC集群的设备之间需要采用高性能并行互连组件进行连接。易飞扬是并行光互连计算的先锋,自2013年起,易飞扬就重点投入高性能并行光模块和互连线缆的开发,系列产品涵盖10G、25G、40G、100G、200G、400G和800G等速率,支持INFNIBAND协议。

92378aca-0c4e-11ee-962d-dac502259ad0.png

基于Intel和NVIDIA的芯片设计支持并行互连组件的服务器光网卡,从10G到200G,并正在向400G/800G延伸;

基于VCSEL激光器、DML激光器或硅光技术平台设计的高速并行光模块,如100G QSFP28 SR4/PSM4,200G QSFP56 SR4/DR4,200G QSFP-DD SR8/PSM8和400G QSFP-DD SR8/DR4等;

基于低功耗设计的短距离并行DAC和AOC互连线缆,如400G QSFP-DD DAC/AOC、 800G QSFP-DD DAC/AOC等;

可支持系统设备自环测试的电回环模块;

创新性的液冷互连光模块和互连解决方案。

高质量的系统、组件及设施共同构建出高性能计算数据中心,这些数据中心还提供HPC所需的经济实惠的电力、网络、可扩展性、冗余和安全性。
责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机
    +关注

    关注

    19

    文章

    7764

    浏览量

    92681
  • HPC
    HPC
    +关注

    关注

    0

    文章

    342

    浏览量

    24825
  • 数据分析
    +关注

    关注

    2

    文章

    1506

    浏览量

    35942

原文标题:数据中心如何支持高性能计算?

文章出处:【微信号:gigalight_yifeiyang,微信公众号:易飞扬通信】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    详解示波器的关键指标

    这些问题,很可能是因为你没有真正理解示波器的关键指标:带宽、采样率和存储深度。今天,我们就来彻底搞懂这三个参数,让你的调试工作事半功倍!
    的头像 发表于 10-29 17:45 3224次阅读
    详解示波器的<b class='flag-5'>三</b>大<b class='flag-5'>关键</b>指标

    【产品介绍】Altair PBS Professional HPC工作负载管理器和作业调度管理系统

    ,并简化集群、云和超级计算机的管理——从最大的高性能计算(HPC)工作负载到数百万小型、高吞吐量作业。借助动态策略、AI工作负载支持、强大的定制API和广泛的硬
    的头像 发表于 09-19 17:03 381次阅读
    【产品介绍】Altair PBS Professional <b class='flag-5'>HPC</b>工作负载管理器和作业调度管理<b class='flag-5'>系统</b>

    高效管理Kubernetes集群的实用技巧

    作为一名经验丰富的运维工程师,我深知在日常的Kubernetes集群管理中,熟练掌握kubectl命令是提升工作效率的关键。今天,我将分享15经过实战检验的kubectl实用技巧,帮助你像艺术家一样优雅地管理K8s
    的头像 发表于 08-13 15:57 601次阅读

    一文看懂AI算力集群

    最近这几年,AI浪潮席卷全球,成为整个社会的关注焦点。大家在讨论AI的时候,经常会提到AI算力集群。AI的要素,是算力、算法和数据。而AI算力集群,就是目前最主要的算力来源。它就像一
    的头像 发表于 07-23 12:18 973次阅读
    一文看懂AI算力<b class='flag-5'>集群</b>

    医疗AI进化的三个关键技术路径

    2025年第二十二届中国脑血管病论坛(CFCVD)上上演了一场颠覆性对决——“Deepseek”、“豆包”和“39AI”大AI(人工智能)模型与数位临床医生围绕脑梗死、脑出血、颅内动脉瘤大经典病例,以病例诊断与治疗方案制定为内容进行现场比拼,在有限时间内对病例进行分析
    的头像 发表于 07-17 14:19 4991次阅读

    热插拔算力集群

    热插拔算力集群指在无需停机的情况下,动态增减计算节点或硬件的算力基础设施,其核心价值在于实现资源的弹性伸缩和业务连续性。以下从关键技术、应用场景及优势三个维度分析: 一、关键技术支撑‌
    的头像 发表于 06-26 09:20 706次阅读

    高性能计算集群在AI领域的应用前景

    随着人工智能技术的飞速发展,高性能计算集群HPC)在AI领域的应用前景日益受到关注。HPC提供的计算能力与AI的智能分析能力相结合,为解决复杂问题和推动科学研究提供了新的动力。1、HPC
    的头像 发表于 06-23 13:07 1039次阅读
    高性能计算<b class='flag-5'>集群</b>在AI领域的应用前景

    redis集群方案详解

    在Redis中提供的集群方案总共有种(一般一redis节点不超过10G内存)。
    的头像 发表于 03-31 10:46 1272次阅读
    redis<b class='flag-5'>三</b>种<b class='flag-5'>集群</b>方案详解

    如何检测极管的三个

    可以用万用表来初步确定极管的好坏及类型 (NPN 型还是 PNP 型 ),并辨别出e(发射极)、b(基极)、c(集电极)三个电极。
    发表于 03-08 16:40

    如何区分场效应管mos管三个引脚

    场效应管mos管三个引脚怎么区分
    发表于 03-07 09:20 0次下载

    Linux系统中最重要的三个命令

    Linux剑客是Linux系统中最重要的三个命令,它们以其强大的功能和广泛的应用场景而闻名。这三个工具的组合使用几乎可以完美应对Shell中的数据分析场景,因此被统称为Linux
    的头像 发表于 03-03 10:37 797次阅读

    使用DDS生成三个信号并在Vivado中实现低通滤波器

    本文使用 DDS 生成三个信号,并在 Vivado 中实现低通滤波器。低通滤波器将滤除相关信号。
    的头像 发表于 03-01 14:31 2444次阅读
    使用DDS生成<b class='flag-5'>三个</b>信号并在Vivado中实现低通滤波器

    ADS828的GND引脚有三个,这三个引脚的接地是哪个接数字地,哪个接模拟地?

    在贵公司的这款AD转换芯片ADS828的GND引脚有三个(1、16、26)想咨询一下这三个引脚的接地是哪个接数字地,哪个接模拟地,还是不用考虑这方面;还有就是在输出偏置电压的时候,在为2.5V的时候,是用CM输出端好,还是用REFT和REFB电阻分压好?
    发表于 02-14 08:27

    HPC工作负载管理的关键要素

    HPC工作负载管理是一复杂而精细的过程,涉及资源分配、作业调度、性能监控与优化以及故障处理与恢复等多个关键要素。下面,AI部落小编带您了解HPC工作负载管理的
    的头像 发表于 02-08 09:53 533次阅读

    云计算HPC软件关键技术

    云计算HPC软件关键技术涉及系统架构、处理器技术、操作系统、计算加速、网络技术以及软件优化等多个方面。下面,AI部落小编带您探讨云计算HPC
    的头像 发表于 12-18 11:23 797次阅读