0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据中心短缺:人工智能未来的致命阻碍?

innswaiter 来源:van 作者:van 2023-10-20 10:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

影响人工智能未来的4个数据中心存储挑战

● 建设新数据中心的成本

● 建设新数据中心需要时间

● 现有数据中心空间不足

● 功率限制

训练人工智能模型会产生巨大的资源消耗,需要大量的资本、时间、空间和电力来部署。最终,人工智能的进步可能归结为解决数据中心短缺的问题。

为什么数据中心对人工智能很重要

数据中心在我们的日常生活中发挥着至关重要的作用,但它们常常被视为理所当然或完全被忽视。每当我们浏览社交媒体、发送消息、在淘宝上订购真空吸尘器或通过银行汇款时,都需要依靠数据中心来处理每一项数字操作。它们是我们IT基础设施的基石。

但随着人工智能需求的爆炸式的激增,数据中心的容量正在减少,需求明显超过供应。虽然关于人工智能的讨论主要集中在芯片和ChatGPT上,以及人工智能产品将如何增加数十亿美元的收入,但我们应该关注的是回答这样一个问题,当对人工智能的需求超过我们现有基础设施所能支持的水平时,会发生什么?

答案似乎很简单,通过建设更多能力来克服能力不足。然而,在实践中,这变得更加困难。

数据中心短缺的4大原因

随着人工智能的发展,对计算能力的需求呈爆炸式增长,这需要密集、复杂的计算能力来训练。

数据中心行业已经面临满足现有企业数字化转型和公共云使用需求的压力。由于部署新构建的成本和时间都很高,因此数据中心通常是根据预测的需求即时交付来构建的。除了供应已经紧张之外,人工智能的指数级采用还推动了前所未有的需求。

生成式人工智能需要的能力是传统工作负载的五倍。据说ChatGPT-4的智力明显更好,需要更多的力量来训练。人工智能的发展竞赛归结为四个关键的供应限制:资金、时间、空间和权力。

1、资本

数据中心的建设成本高昂。一座25万平方英尺的中型数据中心建筑,要花费近5亿美元才能完全建成。

预计对人工智能的需求在数百兆瓦到千兆瓦之间,全部价格将达到数百亿美元。这是一大笔资金。当利率高企,资金难以筹集时,数据中心的价格就会上涨,这使得筹集必要的资金和满足需求变得更具挑战性。筹集所需资金也需要更长的时间,这延长了建设时间,进一步拖慢了一切。

最近,许多传统数据中心提供商因重组或破产而分心或陷入停滞,这进一步挑战了容量的及时交付。数据中心运营商仍然可以利用这些资金来为新容量提供资金,只是不会像零利率时代那么容易。赢家将是那些拥有有效部署资本和有效运营记录的人。

2.时间

建设一个数据中心需要24到36个月的时间。当然,提供商可以同时进行多个项目,但大多数项目仍需要数月至数年才能完成。在当前需求猛增之前,许多项目都是基于更为温和的需求预测而建造的。

最重要的是,该行业仍在努力应对供应链挑战,以提供为现代数据中心供电和冷却所需的机械电气和冷却系统。这些时间表已从两年前的12至24周缩短至52至80周。

新容量上线需要时间,而且即使上线也可能不够。然而,拥有数据中心下方的房地产并追求多设施园区战略的运营商将最有能力通过控制土地使用和缩短上市时间来快速扩大规模。

3.空间

整个行业剩余的可用空间所剩无几,特别是在拥有任何额外产能的优先购买权(ROFR)的客户看到需求增长快于供应的情况下,他们现在正在要求这些选择。

目前,GPU驱动的高性能计算(HPC)集群正在被许多企业采用,以训练人工智能应用,但它们并不是数据中心空间需求的唯一驱动因素。超大规模公共云和传统企业技术部署的自然增长也将继续强劲,这将在未来12到18个月内给供应带来更大的压力。如果我们继续沿着这条道路前进,没有任何出人意料的技术创新。

应对这一挑战的解决方案是数据中心提供商设计新设施,以适应从传统的高架地板、风冷企业应用到板式地板和水冷超大规模云或HPC工作负载的工作负载。这确保了无论上线的容量都可以快速适应市场最关键的瓶颈。

4.能源

一切都与电力有关。这些用于人工智能的高性能计算集群中使用的GPU使用的功率是传统工作负载的五倍。

电力已经供不应求,因为我们已经看到主要的数据中心市场宣布限制提供已经承诺的扩展电力。预计这一趋势将持续下去,需求的增加会给电网带来更大的压力,而向可再生能源的过渡需要时间的调整和完善,将产生更多的瓶颈。

智能数据中心提供商通过提高效率,将多设施园区选址在发电源附近,甚至部署自己的分站,走在了前面。

数据中心短缺持续存在会发生什么?

在研究了这四个领域之后,仍然存在一个问题:“如果我们无法克服这些限制,会发生什么?”其影响既深远又容易被忽视。

首先,它可能会阻碍人工智能应用开发人员部署GPU驱动的HPC集群的速度,这些集群需要训练底层大型语言模型(llm),和/或最终的推理阶段,在那里我们看到对基于这些llm构建应用的访问需求。

它还可能会抑制数据中心容量满足云提供商和正在增加现有工作负载企业的需求的能力。如今每个人都已经依赖这些来为SaaS应用、社交媒体、视频流、游戏、电子商务以及现代互联世界的便利提供动力,更不用说未来由人工智能驱动的应用了。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134443
  • 数据中心
    +关注

    关注

    16

    文章

    5515

    浏览量

    74642
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261467
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能数据中心的光纤布线策略

    数据中心的光纤布线策略,包括布线规划、光纤选型、架构设计、成本优化以及未来趋势等。 布线规划的重要性 在人工智能数据中心中,光纤布线的规划是确保系统高效运行的关键步骤。合理的布线规划不
    的头像 发表于 11-21 10:21 75次阅读

    AI数据中心供电系统的发展现状和未来趋势

    AI数据中心作为数字时代的核心基础设施,承担着海量数据的存储、处理和传输任务,而供电系统是其稳定运行的“生命线”。随着云计算、大数据人工智能等技术的快速发展,
    的头像 发表于 09-24 17:07 2838次阅读
    AI<b class='flag-5'>数据中心</b>供电系统的发展现状和<b class='flag-5'>未来</b>趋势

    赋能人工智能未来:ADI宣布支持800 VDC数据中心架构

    , Inc. (ADI)推出创新解决方案,为数据中心下一代800 VDC架构提供有力支持。该系列解决方案包含高可靠性热插拔与一级电源产品,旨在实现安全、高效且智能的配电,精准满足现代AI工厂系统的供电需求。 赋能人工智能
    的头像 发表于 08-28 21:18 856次阅读
    赋能<b class='flag-5'>人工智能</b><b class='flag-5'>未来</b>:ADI宣布支持800 VDC<b class='flag-5'>数据中心</b>架构

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    人工智能算力需求呈指数级增长的2025年,数据传输效率已成为制约AI发展的关键瓶颈。作为全球AI光模块领域的标杆企业,深圳市睿海光电凭借技术领先的800G OSFP光模块解决方案,正在重新
    发表于 08-13 16:38

    光纤为何是AI就绪型数据中心的基石?

    康普数据中心业务部大中国区销售总监 刘伟岗 随着人工智能(AI)在各行各业加速落地应用,企业领导者也开始从根本上重新思考数据中心的建设和运营方式。同样,AI在中国市场势头正猛,各行业正从“互联网
    的头像 发表于 06-13 17:07 840次阅读

    人工智能正在改变世界

    它需要大量的处理能力,需求每一百天就会翻一番,这推动了人工智能基础设施的投资热潮。未来数据中心需要满足和管理对计算资源前所未有的需求:既要能智能高效地提供支持,又要满足相应的计算、内
    的头像 发表于 06-13 10:19 664次阅读

    如何有效地管理人工智能数据中心的电源

    作者:Kenton Williston 投稿人:DigiKey 北美编辑 人工智能 (AI) 和机器学习 (ML) 的兴起提出了前所未有的电力需求。下一代数据中心在电源管理、效率和可靠性方面
    的头像 发表于 05-25 11:30 677次阅读
    如何有效地管理<b class='flag-5'>人工智能</b><b class='flag-5'>数据中心</b>的电源

    数据中心液冷技术和风冷技术的比较

    (Power Usage Effectiveness,电源利用效率)<1.2,而传统的风冷制冷方式已经无法满足数据中心的散热需求,更加高效的液冷方案应运而生。特别在人工智能领域,随着智算需求的爆发,液冷方案已经成为数据中心的首选
    的头像 发表于 05-09 09:41 2781次阅读
    <b class='flag-5'>数据中心</b>液冷技术和风冷技术的比较

    施耐德电气发布数据中心高密度AI集群部署解决方案

    人工智能(AI)驱动的产业革命浪潮中,数据中心正迎来深刻变革。面对迅猛增长的人工智能算力需求,部署高密度AI集群已成为数据中心发展的必然选择。
    的头像 发表于 04-19 16:54 1238次阅读
    施耐德电气发布<b class='flag-5'>数据中心</b>高密度AI集群部署解决方案

    适用于数据中心和AI时代的800G网络

    随着人工智能(AI)技术的迅猛发展,数据中心面临着前所未有的计算和网络压力。从大语言模型(LLM)训练到生成式AI应用,海量数据处理需求推动了网络带宽的快速增长。在此背景下,800G网络技术应运而生
    发表于 03-25 17:35

    Cadence颠覆AI数据中心设计

    日前举办的英伟达 GTC 2025 开发者大会汇聚了众多行业精英,共同探讨人工智能未来。而人工智能正在重塑全球数据中心的格局。据预测,未来
    的头像 发表于 03-21 15:43 856次阅读

    展望2025:人工智能将改变数据中心建设的方式

    康普企业网络大中华区总经理兼副总裁陈岚 回望2024,人工智能(AI)对行业产生的影响显露无疑。去年,数据中心对AI计算的需求呈指数级增长,这将促使行业采用更高效的流程,加快构建速度,并更具创造性地
    的头像 发表于 02-24 16:27 1037次阅读

    安科瑞:以综合能效管理解决方案,赋能人工智能时代的数据中心可持续发展

    人工智能与可持续发展的双重浪潮下,安科瑞凭借其综合能效管理解决方案,不仅为数据中心行业提供了降本增效的实践路径,更推动了全球数字基础设施向绿色低碳转型。未来,随着技术的持续迭代与生态合作的深化,安科瑞有望成为AI时代
    的头像 发表于 02-21 15:37 808次阅读
    安科瑞:以综合能效管理解决方案,赋能<b class='flag-5'>人工智能</b>时代的<b class='flag-5'>数据中心</b>可持续发展

    构建未来数据中心 发挥人工智能AI的力量

    为了满足性能需求,数据中心架构师必须扩展系统结构,通过 PAM4 调制方案支持 224 Gbps 数据传输速率。这给互连解决方案带来了巨大的挑战,推动新的技术的运用,同时充分利用路由、空间效率和电源
    的头像 发表于 02-08 15:35 807次阅读
    构建<b class='flag-5'>未来</b><b class='flag-5'>数据中心</b> 发挥<b class='flag-5'>人工智能</b>AI的力量

    人工智能对数据中心基础设施带来了哪些挑战

    (太瓦时),约占全球总用电量的 2%。在美国,拥有全球三分之一的数据中心,耗电量为 260 TWh,占总用电量的 6%。   预测未来具有挑战性,这取决于部署了多少非常耗电的图形处理单元(GPU)来应对人工智能技术的需求,当然还
    发表于 12-31 13:48 630次阅读
    <b class='flag-5'>人工智能对数据中心</b>基础设施带来了哪些挑战