0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

重新思考数据中心架构,推进AI的规模化落地

时光流逝最终成了回忆 来源:电子发烧友网 作者:Marie Hattar 2025-05-30 13:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能AI)对计算资源的贪婪需求推动了基础设施的变革,业界正着力解决如何满足AI在功率、可扩展性以及效率等方面的需求。这促使大量投资涌入,旨在重新配置数据中心架构,以更好应对上述及其他技术要求。问题的核心在于,智能性的构建需要巨大的算力支持。随着AI复杂度以每年一个数量级的速度递增,数据中心必须快速扩展。一个直观的参照可以说明这一需求增长的速度:到2027年,AI工作负载的能源消耗将超过阿根廷的年用电量。

没有万能之法

AI正在重新定义各类数据中心的架构,包括超大规模数据中心、现场数据中心、主机托管数据中心和边缘数据中心。迄今为止,大家的注意力主要集中在超大规模数据中心的竞争上。指数级增长的计算资源需求正在催生站点容量超过1GW的AI集群。麦肯锡预测,到2030年,欧洲和美国60%以上的AI工作负载将托管在超大规模基础设施上。

从超大规模数据中心到边缘:架构的演进

数据中心必须能够支持像大型语言模型(LLM)训练这样的AI工作负载。这就需要对设施的设计和架构进行全面升级。每个机架的功率必须增加到200-300kW,以支持密集型计算,并配备增强冷却解决方案以满足这种密集性需求。GPU和TPU等专用硬件必须与扩展的存储系统相集成,以应对海量数据的管理需求。为实现硬件的独立管理和扩展,分离架构正被广泛部署,支持不同工作负载高效利用资源。为了适应AI的流量模式,网络架构也需要进行更新,否则AI集群可能会陷入“数字交通堵塞”——强大的数据处理能力因数据瓶颈而无法发挥其应有的效能。

除了超大规模设施外,AI正在推动对去中心化基础设施的需求,以支持本地数据处理。这需要专为边缘工作负载设计的数据中心——在较小的物理空间和较低能耗下实现高性能。到2030年,随着越来越多的处理任务向边缘转移,该市场预计将超过1600亿美元。

该增长源于自动驾驶等应用中,对于更加贴近终端用户的实时处理能力的迫切需求。在这些应用中,更快的决策速度至关重要。该方法可以降低延迟,更好地支持这个由物联网5G技术驱动的超连接世界。

随着AI应用的日益成熟,推理工作负载的增长速度已经远超模型训练。基础设施也需要适应这种从训练到推理的转变——DeepSeek R1和OpenAI v3的成功有赖于此。这类推理系统利用经过训练的模型来评估实时数据,从而高效地做出决策或完成任务。

边缘连接设备将产生大量的数据。因此,数据中心需要达到一定规模,以支持低延迟网络和灵活的资源分配,从容应对突发推理需求高峰。

以AI扩展AI

有趣的是,AI既是问题所在,又是解决问题的关键。智能化对于应对扩展挑战和确保高效运营至关重要。AI可以通过多种方式助力数据中心现代化,其中包括:

提高能源效率对于可持续运营至关重要。数据中心可以通过部署AI来自动调节冷却系统和服务器工作负载,应对需求高峰。实施智能节能技术有助于最大限度地减少浪费和运营成本,同时保持性能水平。

预测性维护利用机器学习在问题发生前进行预测。这可以最大限度地减少停机时间,并有助于延长基础设施的使用寿命。考虑到扩展所涉及的规模和成本,主动安排维修和更新以优化资源利用率的能力具有重要意义。

数字孪生与AI相结合,可创建动态模型来对组件和系统进行测试和验证。这些解决方案可用于确保复杂的数据中心保持稳健、富有弹性,并能支持未来的需求。AI算法会分析有关性能和环境条件的历史数据,为优化运营提供洞察。这些解决方案可以使用AI工作负载来模拟网络性能,从而发现并解决潜在的瓶颈问题。先进的测试和仿真工具是创建可扩展、高效、可靠的基础设施所需的技术堆栈的重要组成部分。

AI将加速完全自主的智能数据中心的实现,这些数据中心几乎可以处理所有操作,包括监控、维护、联网、能源管理和安全等,并且只需极少的人工投入。

面向未来的AI基础设施

随着AI的不断发展,数据中心必须适应日益复杂的工作负载。运营商迫切希望能以可持续的方式扩展基础设施来满足需求,而不必牺牲性能或可靠性。由于AI的未来发展仍存在不确定性,打造灵活、富有弹性且易于适应的基础设施至关重要。

通过AI系统编排在超大规模计算能力和边缘灵活性之间取得平衡将成为区分成败的关键,而那些能够顺应这一趋势的企业将在AI革命中脱颖而出。

作者:是德科技高级副总裁Marie Hattar

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    16

    文章

    5514

    浏览量

    74627
  • AI
    AI
    +关注

    关注

    89

    文章

    38077

    浏览量

    296301
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2025 RISC-V产业发展大会 | 赛昉科技全景展示规模化商用成果

    能力,为RISC-V产业落地提供了扎实范例。展台实景:多场景芯片方案实现规模化部署赛昉科技展台成为全场焦点,集中展示了其在多个关键领域的芯片落地成果:数据中心实现关
    的头像 发表于 11-27 11:03 307次阅读
    2025 RISC-V产业发展大会 | 赛昉科技全景展示<b class='flag-5'>规模化</b>商用成果

    赛昉科技重磅发布新产品,RISC-V实现数据中心规模化商用突破

    2025年11月14日,中国香港——赛昉科技隆重发布首款基于RISC-V架构数据中心管理芯片“狮子山芯”。作为一款具有里程碑意义的产品,“狮子山芯”成功实现了RISC-V在数据中心领域的首次
    的头像 发表于 11-17 10:02 385次阅读
    赛昉科技重磅发布新产品,RISC-V实现<b class='flag-5'>数据中心</b><b class='flag-5'>规模化</b>商用突破

    软通动力携手华为昇腾推进AI智能体规模化部署

    企业AI智能体规模化落地”主题演讲,分享了软通动力在AI智能体领域的前沿实践与成熟解决方案,获得行业高度关注。
    的头像 发表于 09-28 17:50 1173次阅读

    睿海光电800G光模块助力全球AI基建升级

    在全球数字转型加速的背景下,超高速光模块作为数据中心AI算力网络的核心部件,正经历从400G向800G、1.6T的迭代浪潮。在这一赛道中,深圳市睿海光电科技有限公司(以下简称“睿海光电”)凭借
    发表于 08-13 19:05

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构AI工厂与AI
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    :全球TOP3云服务商在其新一代数据中心规模部署睿海光电产品 四、服务承诺:全方位保障客户利益 睿海光电提供行业领先的服务保障: 质量保证 :3年超长质保,终身维修服务 定制支持 :专业的OEM
    发表于 08-13 16:38

    华为面向拉美地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025拉美站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向拉美地区发布全新升级的星河AI
    的头像 发表于 08-11 10:42 1989次阅读

    软通动力如何推动工业AI规模化落地

    近日,在2025世界人工智能大会(WAIC 2025)“AI数算 重构智造产链生态”2025智能趋势论坛上,软通动力集团咨询与数字创新服务线联席总裁李国亮受邀出席圆桌对话:《智造“最后一公里”》——工业AI
    的头像 发表于 07-30 17:27 848次阅读

    光纤为何是AI就绪型数据中心的基石?

    康普数据中心业务部大中国区销售总监 刘伟岗 随着人工智能(AI)在各行各业加速落地应用,企业领导者也开始从根本上重新思考
    的头像 发表于 06-13 17:07 835次阅读

    适用于数据中心AI时代的800G网络

    ,成为新一代AI数据中心的核心驱动力。 AI时代的两大数据中心AI工厂与AI
    发表于 03-25 17:35

    优化800G数据中心:高速线缆、有源光缆和光纤跳线解决方案

    广泛应用于网卡、交换机、服务器、超级计算机、云计算和数据中心的短距离互连。 800G高速线缆 随着大规模和超大规模数据中心的兴起,服务器机架的功耗显著增加,垂直布线距离减少。因此,800G
    发表于 03-24 14:20

    千亿规模AI数据中心,电感如何提高电源效率?

    市场规模为1251亿美元,2025年将增至1587亿美元,2028年有望达到2227亿美元。其中,生成式人工智能服务器占比将从2025年的29.6%提升至2028年的37.7%。   在数据中心规模增长的同时,也面临着能源问题。
    的头像 发表于 03-15 00:53 2093次阅读

    华为发布新一代站点能源架构AI数据中心建设理念

    西班牙巴塞罗那2025年3月13日 /美通社/ -- 在MWC25巴塞罗那期间举办的产品与解决方案发布会上,华为数据中心能源及关键供电产品线总裁何波发布新一代站点能源架构"Single
    的头像 发表于 03-13 15:38 626次阅读
    华为发布新一代站点能源<b class='flag-5'>架构</b>及<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>建设理念

    数据中心发展与改造

    全球多数数据中心基础设施已超六年,能耗高而效率低。随着AI的发展,企业正致力于整合与提升能效的现代改造。同时数据中心呈现规模化、高密
    的头像 发表于 02-28 16:50 734次阅读
    <b class='flag-5'>数据中心</b>发展与改造

    韩国将建全球最大AI数据中心

    据最新报道,韩国即将启动一项雄心勃勃的计划——建设全球最大的人工智能(AI)数据中心。该数据中心不仅在规模上令人瞩目,更在技术和投资上展现了韩国的强大实力。 据悉,该
    的头像 发表于 02-20 09:24 889次阅读