0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

引领智算中心的冷却技术,下一个风口在哪里?

爱云资讯 2024-10-14 15:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

——专访维谛技术全球专家Simon Brady与高级经理王超女士

wKgZomcMwZSAV-J_AAPEgxFt3r0639.png

访谈背景:

在数字化时代的浪潮中,全球智算市场正以前所未有的速度蓬勃发展,数据中心作为这一变革的基石,正经历着前所未有的挑战与机遇。特别是在智算中心的算力集群高密散热和节能降耗方面的需求,更是对传统数据中心冷却技术提出了更高要求。在这样的背景下,我们有幸邀请到维谛技术(Vertiv)的两位专家——Simon Brady(Vertiv Global Expert)以及维谛技术热管理解决方案部高级经理王超女士,就智算中心冷却技术的现状与未来进行了深入探讨。

1、全球智算市场及中国智算市场的发展态势

Simon Brady在采访中明确指出,从全球范围来看,智算市场的发展呈现出几个显著特点。首先,智算的应用场景日益广泛,不再局限于传统的互联网行业,而是逐步向金融、医疗、教育等各行各业扩展,如印度的一家银行通过部署智算中心研究客户习惯,显著提升了服务质量。

其次,全球头部互联网公司如谷歌、亚马逊等都在积极部署大量智算资源来训练自己的大模型,以应对日益复杂的数据处理需求。

王超女士也指出,国内的智算发展同样迅速。国内头部互联网公司和科技企业纷纷投入巨资建设智算中心,模型训练,推动行业创新。可以说,智算正在从头部客户向行业客户扩展,帮助更多企业优化和提升工作效率。

2、AI时代对制冷技术提出的全新挑战和要求

在AI时代,智算中心在制冷层面面临着更高层级的要求。一旦设备散热出现问题,对数据中心将会造成毁灭性的伤害,未来在智算中心的冷却技术的研发上也提出了越来越高的要求。

wKgaomcMwZSAakB2AAXt4a5KrTA540.png

针对未来智算中心建设的需求,Simon Brady认为,在AI时代,智算中心的制冷需求发生了显著变化。随着芯片技术的发展,特别是从CPUGPU的转变,单个芯片的功率密度急剧攀升,从最初的300—400W提升到了现在的700—800W,甚至更高。这种高功率密度对制冷技术提出了更高要求,需要更高效、更节能的散热解决方案。

未来的智算中心冷却技术将向液冷方向发展,液冷技术能够直接对芯片进行散热,大幅提升散热效率,同时降低能耗。Simon Brady和王超女士都认为:未来,液冷技术将逐渐成为智算中心制冷的主流方案,特别是在高功率密度的应用场景中。

王超女士表示,维谛技术目前拥有冷板式液冷和浸没式液冷两种液冷解决方案,能够显著提高数据中心的冷却效率和能源利用效率,以其高热传导特性,能够有效应对高功率密度的散热需求。

在液冷领域,王超女士指出,维谛技术更是走在了行业前列,研发了多种液冷设备,包括冷板液冷、浸没液冷以及背板液冷等,这些设备能够更好地匹配AI芯片的散热需求,冷板液冷可以直接将冷却液导入芯片表面的微通道冷板中进行散热;浸没液冷则将整个服务器浸泡在冷却液中,实现全方位散热。这些液冷设备在实际应用中取得了显著效果,大幅提升了智算中心的散热效率和能效比。

她进一步解释说,在应对算力集群的高密散热挑战方面,维谛技术拥有一系列创新性的解决方案。在风冷领域,我们积累了丰富的经验和技术储备,能够根据不同应用场景提供定制化的风冷解决方案,同时,我们也在不断优化和升级风冷技术,提高散热效率和能效比。

3、AI快速发展的背景下,风冷和液冷将如何平衡?

在讨论风冷与液冷技术的融合时,Simon Brady表示,即使在液冷时代,风冷技术仍将发挥重要作用。风冷结合智能控制是一个关键点,做好控制是做好节能的前提。在液冷方面,未来单机柜的功率将进一步提升,从当前的40kW、100kW,到未来的200kW,甚至更高的密度,液冷技术将不断迭代。

wKgaomcMwZSAGRfQAARza1iovg0605.png

王超女士介绍,维谛技术在液冷领域拥有冷板式液冷、浸没式液冷和DCD背板类产品,将结合功率密度和场景,进行全面的产品规划。目前,国内智算发展仍以风冷为主,风冷占据了80%或更高的市场空间。风冷技术的界限在于,如果是远端制冷的方式,可以解决单机柜20kW到25kW的散热需求,如果单机柜功率密度进一步提升,就需要用到近端制冷的解决方案。

4、2025年的冷却技术的发展方向

谈到2025年风冷和液冷比例的变化,Simon Brady指出,风冷依然是当前的主流,但随着智算的发展,液冷的比例将会逐渐上升。他强调,整个行业的变化非常快,液冷已经成为全球的行业热点。在传统数据中心,风冷仍将是主流解决方案,而AI液冷则是关键方案。因此,液冷的比例不会迅速达到50%这样的比例。

Simon Brady还提到,从技术的维度来讲,无论是在海外还是国内部署液冷,技术都是类似的。最大的差异在于供应的维度,海外有条件和全球头部的芯片厂家做配合,而国内的优势在于供应链。对于芯片规格的理解以及对细节问题的理解,需要和芯片厂家有更紧密地配合,以确保设备能够更好地匹配芯片的散热要求。

在谈及中国市场的占有变化趋势时,Simon Brady表示,AI发展最快的还是互联网企业,尤其是美国的互联网企业,如亚马逊、谷歌等,他们部署了大量的芯片来训练自己的模型,因此美国的发展速度非常快。紧随其后的是欧洲,而中国的智算发展增长速度也达到了35%甚至更高。尽管通用计算和传统计算的增长速度是5%到8%,但智算的增长速度远超通算和传统计算。从业务角度看,美国市场的增速比欧洲和中国市场都要快,这得益于美国互联网公司能够优先获取芯片,从而在智算领域发展更快。

Simon Brady分享了维谛技术在全球范围内推广解决方案的经验。他指出,维谛技术与全球头部互联网企业合作,提供了大量的风险解决方案。在海外,部分客户具备冷冻水的冷源,维谛技术会结合这些条件,帮助客户部署风冷和液冷散热方案。液冷方案的实施取决于客户当前的基础设施条件,维谛技术会根据具体情况制定最适合用户的方案。在海外,维谛技术的部署规模非常庞大,部分客户单个项目的规模甚至达到了30MW。有些客户也会按照每个模块3~5MW的规模进行模块化建设,再通过叠加模块形成更大的规模。

王超女士介绍,单机柜功率密度达到100kW时,一个非常小的算力微模块总功率的就可以达到1MW,数据中心部署方案需要同步调整。未来,单机柜和单模块的功率密度将进一步提升,维谛技术也会紧密结合智算发展,从芯片散热,到机房内部集热,再到户外散热,做好数据中心热管理链产品升级迭代。

通过这次深入的访谈,我们可以看到维谛技术在智算中心冷却技术领域的创新和领导地位及深远的技术探索。公司的解决方案不仅满足了高密度散热的需求,还实现了能效提升和成本节约,为数据中心的绿色发展提供了强有力的支持。随着技术的不断进步,维谛技术将继续引领智算中心冷却技术的革新,为全球数字化转型贡献力量。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 电源
    +关注

    关注

    185

    文章

    18719

    浏览量

    261531
  • 冷却
    +关注

    关注

    0

    文章

    47

    浏览量

    18311
  • 智算中心
    +关注

    关注

    0

    文章

    109

    浏览量

    2455
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI教父Hinton对话云天励飞陈宁

    在大模型步入深水区的当下,AI 的下一个临界点究竟在哪里?在 2025 GIS 全球创新峰会现场,深度学习奠基人、“AI 教父” Geoffrey Hinton 与云天励飞董事长兼 CEO 陈宁
    的头像 发表于 12-03 14:04 390次阅读

    华为液冷热管理控制器TMU荣获“数据中心冷却创新奖”

    近日,W.Media 2025中东云计算和数据中心产业奖项在迪拜揭晓,华为液冷热管理控制器TMU凭借卓越的换热性能、前瞻的可靠性设计以及敏捷的智能运维能力,在众多冷却技术中脱颖而出,斩获“数据
    的头像 发表于 09-16 15:19 1730次阅读

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口

    科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口
    的头像 发表于 09-03 11:24 542次阅读

    【原创】TDMS设置下一个写入位置函数的摸索

    labview在20版本前,tdms都有高级函数,写入文件位置set file positon,但是在20版本后被取消了。取而代之是‘tdms设置下一个写入位置函数’ 本意是想利用tdms设置
    发表于 08-11 20:54

    抓住MEMS压力传感器风口,瑞之辰让感知落地

    当AI这个智能大脑备受关注的时候,扮演“眼睛”、“耳朵”和“皮肤”的MEMS(微机电系统)传感器早已悄然进入黄金赛道,成为下一个快速起飞的风口。而深圳市瑞之辰科技早已明确这点,正在通过自身技术的实力
    的头像 发表于 07-30 11:34 982次阅读
    抓住MEMS压力传感器<b class='flag-5'>风口</b>,瑞之辰让感知落地

    AI玩具或成为下一个万亿新赛道

    如果你将拥有家庭新成员,你首先会想到什么?是孩子还是宠物?如果我说你下一个家庭成员,或许是会“察言观色”的AI玩具,这件事是不是听上
    的头像 发表于 07-29 10:15 918次阅读

    曙光数创亮相2025中国智中心全栈技术大会

    近日,曙光数创副总裁兼CTO张鹏携三大液冷新品,正式亮相『2025中国智中心全栈技术大会』暨第六届中国数据中心绿色能源大会。曙光数创作为液冷数据
    的头像 发表于 06-13 14:40 885次阅读

    ad7616 burst模式读取数据时,是否可以在下一个convst启动转换?

    ad7616 burst模式读取数据时,是否可以在下一个convst启动转换,但busy还没有拉低的情况下继续读取上次转换的数据吗?主要是串行读取时,有可能出现convst临界的情况,如果这样可以的话,能够提升小部分con
    发表于 04-15 07:50

    Molex莫仕助力数据中心浸没式冷却系统未来发展

    伴随数据中心规模的日益扩大,力需求不断增加,传统空气冷却方法愈发力不从心。浸没式冷却(将硬件浸入介质液体中)提供了更有效的热管理方法。然而,这种
    的头像 发表于 03-17 15:05 912次阅读

    信而泰CCL仿真:解锁AI力极限,智中心网络性能跃升之道

    中心RoCE网络提供精准评估方案,助力企业突破力瓶颈,释放AI澎湃动力! 什么是智中心中心
    的头像 发表于 02-24 17:34 1014次阅读
    信而泰CCL仿真:解锁AI<b class='flag-5'>算</b>力极限,智<b class='flag-5'>算</b><b class='flag-5'>中心</b>网络性能跃升之道

    中心的核心硬件是什么?

    中心,作为人工智能时代的关键基础设施,其核心硬件的构成与性能直接影响着智能计算的效率与质量。以下是对智中心核心硬件的详细阐述:、AI
    的头像 发表于 02-17 14:42 2059次阅读
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>的核心硬件是什么?

    人工智能的下一站在哪里

    DeepSeek的爆发进步推动了AI行业的发展速度,这让人们不得不想象AI的下一站在哪里?维智科技所深耕的时空大模型与AI发展的逻辑轨迹又是如何联系的?
    的头像 发表于 02-14 10:27 812次阅读

    中心的入门指南,技术小白也能懂

    是什么?智中心,全称智能计算中心,是专门为人工智能应用提供强大计算能力和数据存储的基础设施。简单来说,它就像
    的头像 发表于 02-08 14:27 1866次阅读
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>的入门指南,<b class='flag-5'>技术</b>小白也能懂

    中心力如何衡量?

    作为当下科技发展的重要基础设施,其力的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智中心算力衡量的详细阐述:
    的头像 发表于 01-16 14:03 4308次阅读
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b><b class='flag-5'>中心</b>的<b class='flag-5'>算</b>力如何衡量?

    中心会取代通用中心吗?

    随着人工智能(AI)技术的飞速发展,计算需求不断攀升,数据中心行业正经历着前所未有的变革。传统的通用中心与新兴的智
    的头像 发表于 01-06 14:45 906次阅读
    智<b class='flag-5'>算</b><b class='flag-5'>中心</b>会取代通用<b class='flag-5'>算</b>力<b class='flag-5'>中心</b>吗?