0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

重新思考数据中心架构,推进AI的规模化落地

时光流逝最终成了回忆 来源:电子发烧友网 作者:Marie Hattar 2025-05-30 13:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能AI)对计算资源的贪婪需求推动了基础设施的变革,业界正着力解决如何满足AI在功率、可扩展性以及效率等方面的需求。这促使大量投资涌入,旨在重新配置数据中心架构,以更好应对上述及其他技术要求。问题的核心在于,智能性的构建需要巨大的算力支持。随着AI复杂度以每年一个数量级的速度递增,数据中心必须快速扩展。一个直观的参照可以说明这一需求增长的速度:到2027年,AI工作负载的能源消耗将超过阿根廷的年用电量。

没有万能之法

AI正在重新定义各类数据中心的架构,包括超大规模数据中心、现场数据中心、主机托管数据中心和边缘数据中心。迄今为止,大家的注意力主要集中在超大规模数据中心的竞争上。指数级增长的计算资源需求正在催生站点容量超过1GW的AI集群。麦肯锡预测,到2030年,欧洲和美国60%以上的AI工作负载将托管在超大规模基础设施上。

从超大规模数据中心到边缘:架构的演进

数据中心必须能够支持像大型语言模型(LLM)训练这样的AI工作负载。这就需要对设施的设计和架构进行全面升级。每个机架的功率必须增加到200-300kW,以支持密集型计算,并配备增强冷却解决方案以满足这种密集性需求。GPU和TPU等专用硬件必须与扩展的存储系统相集成,以应对海量数据的管理需求。为实现硬件的独立管理和扩展,分离架构正被广泛部署,支持不同工作负载高效利用资源。为了适应AI的流量模式,网络架构也需要进行更新,否则AI集群可能会陷入“数字交通堵塞”——强大的数据处理能力因数据瓶颈而无法发挥其应有的效能。

除了超大规模设施外,AI正在推动对去中心化基础设施的需求,以支持本地数据处理。这需要专为边缘工作负载设计的数据中心——在较小的物理空间和较低能耗下实现高性能。到2030年,随着越来越多的处理任务向边缘转移,该市场预计将超过1600亿美元。

该增长源于自动驾驶等应用中,对于更加贴近终端用户的实时处理能力的迫切需求。在这些应用中,更快的决策速度至关重要。该方法可以降低延迟,更好地支持这个由物联网5G技术驱动的超连接世界。

随着AI应用的日益成熟,推理工作负载的增长速度已经远超模型训练。基础设施也需要适应这种从训练到推理的转变——DeepSeek R1和OpenAI v3的成功有赖于此。这类推理系统利用经过训练的模型来评估实时数据,从而高效地做出决策或完成任务。

边缘连接设备将产生大量的数据。因此,数据中心需要达到一定规模,以支持低延迟网络和灵活的资源分配,从容应对突发推理需求高峰。

以AI扩展AI

有趣的是,AI既是问题所在,又是解决问题的关键。智能化对于应对扩展挑战和确保高效运营至关重要。AI可以通过多种方式助力数据中心现代化,其中包括:

提高能源效率对于可持续运营至关重要。数据中心可以通过部署AI来自动调节冷却系统和服务器工作负载,应对需求高峰。实施智能节能技术有助于最大限度地减少浪费和运营成本,同时保持性能水平。

预测性维护利用机器学习在问题发生前进行预测。这可以最大限度地减少停机时间,并有助于延长基础设施的使用寿命。考虑到扩展所涉及的规模和成本,主动安排维修和更新以优化资源利用率的能力具有重要意义。

数字孪生与AI相结合,可创建动态模型来对组件和系统进行测试和验证。这些解决方案可用于确保复杂的数据中心保持稳健、富有弹性,并能支持未来的需求。AI算法会分析有关性能和环境条件的历史数据,为优化运营提供洞察。这些解决方案可以使用AI工作负载来模拟网络性能,从而发现并解决潜在的瓶颈问题。先进的测试和仿真工具是创建可扩展、高效、可靠的基础设施所需的技术堆栈的重要组成部分。

AI将加速完全自主的智能数据中心的实现,这些数据中心几乎可以处理所有操作,包括监控、维护、联网、能源管理和安全等,并且只需极少的人工投入。

面向未来的AI基础设施

随着AI的不断发展,数据中心必须适应日益复杂的工作负载。运营商迫切希望能以可持续的方式扩展基础设施来满足需求,而不必牺牲性能或可靠性。由于AI的未来发展仍存在不确定性,打造灵活、富有弹性且易于适应的基础设施至关重要。

通过AI系统编排在超大规模计算能力和边缘灵活性之间取得平衡将成为区分成败的关键,而那些能够顺应这一趋势的企业将在AI革命中脱颖而出。

作者:是德科技高级副总裁Marie Hattar

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    18

    文章

    5754

    浏览量

    75195
  • AI
    AI
    +关注

    关注

    91

    文章

    40941

    浏览量

    302517
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    意法半导体为超大规模AI数据中心破解供电难题

    AI大模型算力需求呈指数级飙升,兆瓦级AI机柜成为主流,传统54V低压配电系统早已触到物理极限,供电端的多重挑战正成为AI数据中心规模化发展
    的头像 发表于 04-07 15:46 216次阅读
    意法半导体为超大<b class='flag-5'>规模</b><b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>破解供电难题

    精彩演讲·不容错过 | 智能规模化:平台驱动,赋能半导体全生态AI分析规模化落地

    精彩演讲不容错过演讲信息论坛:设计创新论坛:AI智能应用和汽车芯片时间:2026年3月26日1645地点:上海浦东嘉里大酒店,三楼,上海厅3演讲主题:智能规模化:平台驱动,赋能半导体全生态AI分析
    的头像 发表于 03-26 13:03 324次阅读
    精彩演讲·不容错过 | 智能<b class='flag-5'>规模化</b>:平台驱动,赋能半导体全生态<b class='flag-5'>AI</b>分析<b class='flag-5'>规模化</b><b class='flag-5'>落地</b>

    Arm CPU推动数据中心业务正加速发展

    AI 正从模型实验阶段,逐步走向规模化产品落地、面向用户的实际应用,并愈发向全天候在线的智能体推理延伸,超大规模数据中心内部正迎来一场更深层次的转变。
    的头像 发表于 03-24 10:15 442次阅读

    1分钟带你了解数据中心供电架构 #电子元器件 #数据中心 #供电架构

    数据中心
    沛城芯动力
    发布于 :2026年02月03日 15:39:04

    Arm技术驱动融合型AI数据中心规模化演进

    要实现人工智能 (AI) 的规模化应用,唯一路径便是开展全栈式系统设计。加速器负责处理驱动 AI 模型的数学运算,而 CPU 才是支撑系统,将计算能力转化为实际价值的核心基础。
    的头像 发表于 01-15 14:06 670次阅读

    泰芯半导体携手生态伙伴助力AI硬件产业规模化落地

    当前,AI大模型加速渗透硬件产业,AI硬件正从 “单点智能” 迈向 “系统级智能”,大模型已成为硬件产品的基础能力之一。顺应这一行业发展趋势,珠海泰芯半导体有限公司(以下简称 “泰芯半导体”)积极携手生态伙伴,以核心芯片技术赋能AI
    的头像 发表于 01-05 17:18 1357次阅读

    赛昉科技2025:引领RISC-V驶入数据中心深水区

    2025年,是RISC-V从技术走向场景的关键一年。赛昉科技始终相信:唯有落地,才能创造真实价值。我们以规模化商用为锚点,推动RISC-V深入数据中心核心、走进千行百业。在此,向您呈上我们这一
    的头像 发表于 01-05 08:05 979次阅读
    赛昉科技2025:引领RISC-V驶入<b class='flag-5'>数据中心</b>深水区

    2025 RISC-V产业发展大会 | 赛昉科技全景展示规模化商用成果

    能力,为RISC-V产业落地提供了扎实范例。展台实景:多场景芯片方案实现规模化部署赛昉科技展台成为全场焦点,集中展示了其在多个关键领域的芯片落地成果:数据中心实现关
    的头像 发表于 11-27 11:03 1312次阅读
    2025 RISC-V产业发展大会 | 赛昉科技全景展示<b class='flag-5'>规模化</b>商用成果

    赛昉科技重磅发布新产品,RISC-V实现数据中心规模化商用突破

    2025年11月14日,中国香港——赛昉科技隆重发布首款基于RISC-V架构数据中心管理芯片“狮子山芯”。作为一款具有里程碑意义的产品,“狮子山芯”成功实现了RISC-V在数据中心领域的首次
    的头像 发表于 11-17 10:02 871次阅读
    赛昉科技重磅发布新产品,RISC-V实现<b class='flag-5'>数据中心</b><b class='flag-5'>规模化</b>商用突破

    软通动力携手华为昇腾推进AI智能体规模化部署

    企业AI智能体规模化落地”主题演讲,分享了软通动力在AI智能体领域的前沿实践与成熟解决方案,获得行业高度关注。
    的头像 发表于 09-28 17:50 1702次阅读

    睿海光电800G光模块助力全球AI基建升级

    在全球数字转型加速的背景下,超高速光模块作为数据中心AI算力网络的核心部件,正经历从400G向800G、1.6T的迭代浪潮。在这一赛道中,深圳市睿海光电科技有限公司(以下简称“睿海光电”)凭借
    发表于 08-13 19:05

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    引领AI时代网络变革:睿海光电的核心竞争力 在AI时代,数据中心正经历从传统架构AI工厂与AI
    发表于 08-13 19:01

    华为面向拉美地区发布全新星河AI数据中心网络方案

    在华为数据通信创新峰会2025拉美站期间,以“星河AI数据中心网络,赋AI时代新动能”为主题的分论坛上,华为面向拉美地区发布全新升级的星河AI
    的头像 发表于 08-11 10:42 2551次阅读

    软通动力如何推动工业AI规模化落地

    近日,在2025世界人工智能大会(WAIC 2025)“AI数算 重构智造产链生态”2025智能趋势论坛上,软通动力集团咨询与数字创新服务线联席总裁李国亮受邀出席圆桌对话:《智造“最后一公里”》——工业AI
    的头像 发表于 07-30 17:27 1219次阅读

    光纤为何是AI就绪型数据中心的基石?

    康普数据中心业务部大中国区销售总监 刘伟岗 随着人工智能(AI)在各行各业加速落地应用,企业领导者也开始从根本上重新思考
    的头像 发表于 06-13 17:07 1422次阅读