0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

这8个因素会导致HPC存储成本增加

存储D1net 来源:存储D1net 作者:存储D1net 2021-02-13 11:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高性能计算要求存储系统具有必要的性能和容量,以确保可靠的操作,但是这些系统的价格很高。

高性能计算(HPC)存储的总拥有成本(TCO)超出每GB的初始价格,这意味着IT团队必须考虑其他价格变量。除系统本身的价格外,还有8个因素会导致HPC存储成本增加。

1不断变化的业务需求

业务需求会随时间变化,支持它们的工作负载也是如此。HPC存储必须适应这些变化,这可能需要及时重新配置、升级和增加容量。例如,存储系统应能够进行扩展,同时确保最少停机时间,因为延误会导致收入损失和生产率下降。即使很少停机, IT部门仍必须购买和部署其他硬件,而这会增加总体TCO。

在某些情况下,企业可能会过度配置其存储系统,以适应将来的业务需求和工作负载波动。但是,这可能导致不必要的支出和更高的长期维护成本,这也会增加总拥有成本。实际上,HPC系统很少会达到100%的利用率(通常接近80%),而且过度配置的存储会进一步影响长期成本。同时,请注意不要过度使用HPC存储系统,因为这会损害应用程序的性能和生产率。

2可靠性和可用性

HPC存储系统应支持持续操作,且确保最少服务中断的情况。该系统应该能够处理驱动器和节点故障,以及其他计划外的中断,同时保持可用性和性能。主要有两种方法可以满足这些要求:前期投资于正确的存储基础架构上,或者后续花费更多的时间和金钱来保持系统正常运行。两种选择都会影响总体拥有成本,但后者通常会导致更高的HPC存储成本。

另一个考虑因素是存储配置。例如,某些RAID级别在驱动器间保持奇偶校验,以提高可靠性,但这需要额外的原始容量。高可用性的存储系统通常会部署冗余组件,例如多路径I / O或双控制器。IT团队可能还会保留备用零件,例如额外的电源。此外,员工必须定期更新或更换组件。所有这些因素都会增加总拥有成本。

3系统和数据保护

对于大多数企业而言,保护存储系统及其数据是最重要的工作,但是这些保护工作具有成本。

存储硬件、软件和固件中内置安全功能会增加TCO,维护安全基础架构所需的日常操作同样会增加TCO。例如,企业需要花费时间和资源来管理私钥和访问控制、监视存储和网络系统,确保符合适用的法规,以及定期执行安全性和合规性审核。

灾难恢复策略也会增加总体拥有成本。备份、快照和故障转移操作通常需要额外设备、软件或服务以及人员。同时,IT团队还必须在物理上保护存储系统,这需要附加的火灾警报、检测设备或其他监视工具。

4配套软件和服务

存储供应商通常会提供可选的支持和服务合同,这可能会显著提高系统的总体拥有成本,具体金额将取决于供应商和服务水平。企业可选择较低前期成本的最小覆盖范围,但这可能会增加其停机的风险,从而导致日后的HPC存储成本更高。有些第三方公司提供存储维护服务,该服务可能比供应商的计划便宜,但IT团队仍必须将这些成本计入TCO。

TCO还应反映支持该存储系统的软件的任何许可费用。这包括直接推动存储操作的软件,以及与HPC存储系统结合使用的第三方软件(例如,专用文件系统或软件定义的存储)。另外,TCO计算应考虑管理和监视存储基础架构所需的任何其他系统或服务。

5存储网络基础设施

存储系统必须能够与其他HPC组件及其他组件进行通信,这就需要可靠的高速网络基础架构,以维持运行。

无论网络结构是以太网、光纤通道还是InfiniBand,IT部门都需要部署和维护组件,例如电缆、交换机、适配器或负载平衡器。在计算存储总拥有成本时,网络成本比较复杂,因为其他HPC组件会共享网络。即使这样,存储总拥有成本也应至少反映这些网络成本的一部分。

像存储系统本身一样,网络基础结构也可能有其自己的服务合同或软件许可费。此外,网络可能会包括冗余组件,例如交换机或适配器,以避免任何单点故障。IT部门可能会维护备件或采取其他措施来限制停机时间,并保持性能。组件更新周期也会增加网络成本。

6操作环境

HPC存储系统需要数据中心空间才能运行。尽管现在HPC系统更密集,可减少部分空间,但IT团队仍应在TCO估算中包含这些成本以及相关的数据中心维护和维修费用。

另一个大支出是为存储系统供电和冷却相关的成本。闪存等技术可以降低功耗,但它们仍会增加总体能源成本。

TCO应该考虑对数据中心进行的任何必要更改,以为存储系统做准备。例如,更密集的机架存储可能需要更新电源、增强散热或强化地板。数据中心可能还需要更多的布线或防火系统,以及额外的冗余,例如额外的发电机或不间断电源。

7人员配备要求

另一个大笔支出是部署和维护HPC存储系统所需的人员。这包括IT员工花费在采购、设置、配置、集成和测试系统的时间。这还包括持续的管理工作,这可能很复杂且很耗时。IT团队必须确保系统以最高的性能运行,同时将中断和停机时间降到最低,这可能会显着增加TCO。

向新存储系统的过渡过程也需要时间和资源,包括将数据从旧系统迁移到HPC存储。在某些情况下,IT团队可能需要招募合格的人员来部署和维护系统,或者他们可能需要培训现有人员。这取决于存储系统本身和员工的情况。无论哪种方式,都可能需要进行投资。

8计划外停机

为了减少开支,企业可能会倾向于购买可靠性较差的存储系统,或者限制员工培训和雇用方面的投资。但是,这可能会导致更长或更频繁的停机时间,并可能导致收入损失。

在Hyperion Research于2020年5月发布的一项研究中,约有一半的受访者表示其HPC存储系统每月或一次以上发生故障。这些受访者表示,停机时间从不到一天到一周不等,一天的停机时间可能从100,000美元以下到100万美元以上不等。

HPC服务中断会对依靠该技术来持续提高生产力和创新的企业造成严重影响。当系统出现故障时,他们的工作通常会停止,从而导致长期的财务后果。尽管这些HPC存储成本可能难以计算,但应始终将它们包括在TCO估算中,尤其是在比较产品时。

责任编辑:xj

原文标题:根据8个因素计算HPC存储成本

文章出处:【微信公众号:存储D1net】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • HPC
    HPC
    +关注

    关注

    0

    文章

    342

    浏览量

    24825
  • 储存
    +关注

    关注

    3

    文章

    203

    浏览量

    22959
  • 高性能计算
    +关注

    关注

    0

    文章

    95

    浏览量

    13761

原文标题:根据8个因素计算HPC存储成本

文章出处:【微信号:D1Net11,微信公众号:存储D1net】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    哪些因素影响电能质量在线监测装置的数据采集?

    电能质量在线监测装置的数据采集受 硬件性能、信号接入、环境干扰、软件配置、电源与安装 五大类因素影响,这些因素直接导致采集数据出现 “精度偏差、时序混乱、信号丢失”,最终影响电能质量
    的头像 发表于 10-23 17:23 748次阅读
    哪些<b class='flag-5'>因素</b><b class='flag-5'>会</b>影响电能质量在线监测装置的数据采集?

    哪些因素导致谐波测量偏差?

    LZ-DZ300B电能质量在线监测装置 谐波测量偏差的产生是硬件特性、信号处理、环境干扰及系统状态等多因素共同作用的结果,具体可归纳为以下几类: 一、硬件系统的固有缺陷 传感器误差 电流 / 电压
    的头像 发表于 08-19 14:12 562次阅读
    哪些<b class='flag-5'>因素</b><b class='flag-5'>会</b><b class='flag-5'>导致</b>谐波测量偏差?

    工艺与材料因素导致铜基板返修的常见问题

    人员改进设计与工艺,提升良率。 设计缺陷 首先,开窗设计不合理是返修的关键因素。开窗面积过大、位置靠近基板边缘或钻孔,引发应力集中,导致开裂或翘曲。另外,线路布局过于密集、线宽线距超出工艺极限,也易引发短路和断
    的头像 发表于 07-30 15:45 378次阅读

    导致环网柜局部放电的因素及其检测方法

    绝缘表面电导增加,引发电晕或沿面放电;此外由于雷电冲击、操作过电压或谐振过电压也可能诱发绝缘薄弱点放电;以及长期高负荷,电流过大也导致导体发热,加速绝缘材料热老化。 在对于环网柜设备来说,这些
    的头像 发表于 06-16 10:21 392次阅读
    <b class='flag-5'>导致</b>环网柜局部放电的<b class='flag-5'>因素</b>及其检测方法

    存储示波器的存储深度对信号分析有什么影响?

    越多(如10Mpts内存可支持1000段×10kpts)。 存储深度不足导致偶发信号遗漏(如仅10kpts内存无法分段记录10毛刺事件)。 案例: 测量100MHz时钟的10
    发表于 05-27 14:39

    康佳特推出高性能COM-HPC模块conga-HPC/cBLS

    Bartlett Lake S)。该处理器采用性能混合架构,结合了多达16高效核心(E核心)和8高性能核心(P核心),可提供高达
    的头像 发表于 02-08 16:49 900次阅读

    HPC工作负载管理的关键要素

    HPC工作负载管理是一复杂而精细的过程,涉及资源分配、作业调度、性能监控与优化以及故障处理与恢复等多个关键要素。下面,AI部落小编带您了解HPC工作负载管理的关键要素。
    的头像 发表于 02-08 09:53 533次阅读

    有哪些常见因素导致ADS8364Y数字地与模拟地短路?

    ,但是INA159正常,请教有谁遇见类似现象啊,原因何在,谢谢啊。 或者是谁知道有哪些常见因素可以导致ADS8364Y数字地与模拟地短路?
    发表于 02-06 06:20

    HPC云计算的技术架构

    HPC云计算结合了HPC的强大计算能力和云计算的弹性、可扩展性,为用户提供了按需获取高性能计算资源的便利。下面,AI部落小编带您了解HPC云计算的技术架构。
    的头像 发表于 02-05 14:51 689次阅读

    影响25Q20D闪存芯片写入速度和使用寿命的因素有哪些?

    影响25Q20D闪存芯片写入速度和使用寿命的因素有哪些?首先我们来谈谈影响写入速度九方面:存储容量和架构:存储容量的增加
    的头像 发表于 01-22 16:48 1000次阅读
    影响25Q20D闪存芯片写入速度和使用寿命的<b class='flag-5'>因素</b>有哪些?

    影响电磁波谱的外部因素

    条件 : 大气密度 :大气中的气体分子影响电磁波的传播,特别是在高频段,如微波和毫米波。 湿度 :湿度的增加导致电磁波的吸收和散射增加
    的头像 发表于 01-20 16:52 1562次阅读

    有哪些些因素导致LDC1614复位?

    使用过程中时常遇到读回数据突然为0的情况,经过检查,发现此时寄存器的值已经变成复位状态了,请问,有哪些些因素导致LDC1614复位?
    发表于 01-02 08:15

    存储成本高吗?费用构成清单

    存储成本相对较高,但具体费用受存储空间大小、数据访问流量、请求次数、服务类型、计费方式、附加费用等多种因素影响。对于需要定制化解决方案的企业用户,云服务商可能还会收取一定的专业服务费
    的头像 发表于 12-27 11:27 1721次阅读

    云计算和HPC的关系

    尽管云计算和HPC在架构、应用场景和成本效益等方面存在显著差异,但云计算和HPC之间并非孤立存在,而是相互补充、协同发展的关系。下面,AI部落小编带您探讨云计算和HPC的关系。
    的头像 发表于 12-14 10:35 667次阅读

    谐波导致设备发热吗?

    谐波导致设备发热。谐波电流在设备中会产生额外的损耗,这些损耗转化为热量,从而导致设备温度升高。具体来说,谐波电流在电机中会产生铁心损耗、绕组损耗以及附加损耗等,这些损耗
    的头像 发表于 12-11 15:28 1135次阅读