0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊云科技推出全新数据中心组件,支持AI创新并进一步提升能效

全球TMT 来源:全球TMT 作者:全球TMT 2024-12-11 17:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

亚马逊云科技最新发布了一套灵活的数据中心组件,以支持新一代生成式AI创新,不仅提供12%的额外算力,还提高了可用性和运行效率。

北京2024年12月11日/美通社/ -- 亚马逊云科技在2024 re:Invent全球大会上,宣布推出一系列数据中心新组件,旨在支持新一代人工智能(AI)创新并满足客户不断变化的需求。亚马逊云科技通过对电源、冷却和硬件设计等进行的一系列创新,构建了一个更加节能的数据中心,为客户进一步创新奠定基础。亚马逊云科技在全球新推出的数据中心都将具备这些新组件,现有的数据中心已经部署了很多关键组件。

亚马逊云科技基础设施服务副总裁Prasad Kalyanaraman表示:"亚马逊云科技通过持续推动基础设施创新,致力于为全球客户构建性能卓越、可靠、安全且可持续发展的云。我们数据中心的这些新能力,包括能源效率的提升以及对新兴工作负载的灵活支持,是我们在云计算领域的又一重要进展。更令人兴奋的是,这些功能均采用模块化设计,这让我们得以对现有基础设施进行升级改造,实现液体冷却并提高能源效率,这不仅为生成式AI应用提供强大的动力,同时还降低了我们的碳足迹。"

亚马逊云科技拥有18年构建大规模数据中心的深厚经验,以及13年为AI工作负载提供基于GPU的服务器的丰富经验。目前,亚马逊云科技的数据中心为全球数百万活跃客户提供服务,包括数十万使用亚马逊云科技AI和机器学习服务的客户,以及全球数万个使用Amazon Bedrock构建其生成式AI应用的客户。随着生成式AI的日益普及以及客户对GPU容量需求的不断增长,亚马逊云科技不断调整和优化数据中心,以支持更高的功率密度需求。主要的提升包括:

1. 简化电气机械设计,提高可用性

亚马逊云科技始终致力于打造业界最可靠的基础设施。简化的电气和机械设计更可靠,并易于维护,能确保客户受益于高可用性,这是亚马逊云科技自创立之日起始终为客户提供的。

亚马逊云科技最新的数据中心设计优化中,就包括简化的电力分配和机械系统,实现基础设施的可用性达99.9999%。同时,简化的系统将可能受到电气问题影响的机架数量减少89%。

在亚马逊云科技的数据中心内,电力供应需经过一系列转换与分配过程,才能抵达IT设备。这一流程中的每一步骤都伴随着效率的损耗、能源的消耗,以及潜在的故障风险。例如,亚马逊云科技简化了电力分配系统,从而将潜在故障点的数量减少了20%。简化的另一个例子还包括将备用电源更紧密地集成至机架附近,并减少排热风扇的数量。亚马逊云科技使用自然压差来排出热空气,这提高了服务器的可用电力。这些改进措施不仅显著降低了整体能耗,还最大限度地减少了故障风险。

2. 在冷却、机架设计和控制系统进行创新

亚马逊云科技推出了一系列新功能及增强功能,致力于为客户提供具有高性能、高可用性和能效卓越的基础设施。亚马逊云科技数据中心的创新包括:

液体冷却:新型的AI服务器将受益于液体冷却更有效地应对高密度计算芯片的冷却需求。亚马逊云科技开发了一项先进的机械冷却解决方案——在其新建及现有数据中心配置"液体到芯片"的冷却系统。一些亚马逊云科技的技术利用不需要液体冷却的网络和存储基础设施,因此更新后的冷却系统将无缝集成空气和液体冷却功能,用于支持包括如Amazon Trainium2的强大AI芯片系列,NVIDIA GB200 NVL72等机架级AI超级计算解决方案,以及亚马逊云科技网络交换机和存储服务器。无论客户运行传统工作负载还是AI模型,这种灵活的多模式冷却设计确保了亚马逊云科技都能以最低的成本为客户提供最佳性能和效率。这种独特的液体冷却机架设计是亚马逊云科技与领先的芯片制造商合作开发的,旨在加快AI工作负载的上市时间。

支持高密度AI工作负载:亚马逊云科技通过优化数据中心的机架布局,最大化电力使用效率。亚马逊云科技通过软件实现了这一点,该软件由数据和生成式AI驱动,能够精确预测服务器的最佳部署方式。亚马逊云科技将减少浪费的电力,包括闲置以及未充分使用的能源,从而更有效地利用可用的能源。

这一设计旨在满足AI工作负载对新一代硬件和高密度机架配置的需求,同时又保持足够的灵活性,适配其他广泛的硬件需求。亚马逊云科技基础设施为客户提供了广泛而深入的计算实例选择,现已提供超过750种Amazon Elastic Cloud Compute (Amazon EC2)实例,让客户可为几乎所有的工作负载选择最合适的处理器、存储、网络、操作系统以及购买选项。除了灵活的多模式冷却解决方案外,亚马逊云科技在电力传输系统上也实现了工程突破,使得亚马逊云科技在未来两年内能够将机架功率密度提升6倍,并有望在未来进一步提升3倍。这部分得益于新的电源架的应用,新的电源架能够高效地在整个机架内分配电力,显著降低了电力转换过程中的损耗。

总体而言,这些创新措施让亚马逊云科技每个站点为客户工作负载提供增加12%的计算能力。这一进步意味着在提供同等计算能力的情况下,所需的数据中心数量将会减少。

升级的控制系统:新推出的由亚马逊自主研发的控制系统已应用于亚马逊云科技的电气与机械设备中,实现了监控、报警和运营流程的标准化。例如,利用亚马逊云科技内部构建的遥测工具使用亚马逊云科技的技术,能够提供实时诊断和故障排除服务,这些服务确保客户保持最佳运行状态。此外,亚马逊云科技在提升控制系统冗余度的同时,也简化了系统复杂性。这些改进使得亚马逊云科技基础设施可用性设计达到99.9999%。

3. 实现能效与可持续的双提升:机械能耗降低46%,混凝土含碳量减少35%

多年来,亚马逊云科技在推动基础设施能效与可持续性方面始终走在行业前列。据研究显示,亚马逊云科技的基础设施效率是企业自建基础设施的4.1倍,通过在亚马逊云科技上优化工作负载,相关的碳足迹能够最高减少99%。在2023年,亚马逊云科技已提前实现了运营所需电力100%来自可再生能源的目标,比原定的2030年提前了七年。

亚马逊云科技不断评估其数据中心的运行,通过不懈的创新提高基础设施的能源利用率。新组件在能效和可持续发展上的更新如下:

更高效的冷却系统,在高峰冷却需求期间,与前一代设计相比预计其机械能耗降低高达46%,同时每兆瓦的用水量不变。设计改变包括全新的单侧冷却系统、减少冷却设备数量以及引入液体冷却功能。

降低数据中心建筑外壳混凝土的固有碳排放量,较行业平均水平最高可降低35%。亚马逊云科技采用了规范的低碳钢和低碳混凝土,并通过优化结构设计来减少钢材的使用总量。

备用发电机将采用可再生柴油,这是一种可生物降解且无毒的燃料,与传统的化石柴油相比,其生命周期内的温室气体排放量可减少高达90%。亚马逊云科技已开始在欧洲和美国的数据中心推广使用可再生柴油作为备用发电机的燃料。

英伟达超大规模与高性能计算事业部副总裁Ian Buck表示:"随着AI需求的不断发展,数据中心亦需同步加速演进。先进的液体冷却解决方案能够高效的冷却AI基础设施,同时显著降低能耗。我们与亚马逊云科技在液体冷却机架设计上的携手合作,将帮助客户以卓越的性能和效率运行高强度的AI工作负载。"

"在Anthropic,我们致力于开发领先的基础模型,而安全、高性能且节能的基础设施是我们成功的关键,"Anthropic计算部门杰出工程师James Bradbury表示:"亚马逊云科技致力于构建先进的数据中心,这是我们选择其作为主要云服务提供商和模型训练合作伙伴的重要原因之一。亚马逊云科技的设计改进显著提升了基础设施的安全性、可扩展性和效率,为AI模型的运行和创新提供了强有力的支撑。"

亚马逊云科技的数据中心新组件将在亚马逊云科技全球基础设施进行部署,覆盖全球34个区域、108个可用区,以及如Amazon Local Zones等其他基础设施。预计在2025年初,包含完整组件的新型亚马逊云科技数据中心建设将在美国启动。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据中心
    +关注

    关注

    16

    文章

    5515

    浏览量

    74628
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296329
  • 亚马逊
    +关注

    关注

    8

    文章

    2720

    浏览量

    85431
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    睿海光电以高效交付与广泛兼容助力AI数据中心800G光模块升级

    核心网络支撑。未来,随着1.6T光模块的落地,睿海光电将进一步推动数据中心向更高性能、更智能化演进,携手全球伙伴开启AI新时代。 睿海光电——AI网络升级的可靠伙伴!
    发表于 08-13 19:01

    加速AI未来,睿海光电800G OSFP光模块重构数据中心互联标准

    :全球TOP3服务商在其新一代数据中心规模部署睿海光电产品 四、服务承诺:全方位保障客户利益 睿海光电提供行业领先的服务保障: 质量保证 :3年超长质保,终身维修服务 定制支持 :专业的OEM
    发表于 08-13 16:38

    施耐德电气助力数据中心突破电力系统运维瓶颈

    从发展初期的大型机时代到如今以虚拟化和计算技术为主导的时代,数据中心作为数字化的核心基础设施,在漫漫进化之路上面临多重挑战,整个行业亟需个行之有效的数字孪生平台,不仅要能支撑电气
    的头像 发表于 06-04 14:22 771次阅读

    如何破解数据中心难题?该方案提供创新策略

    ,占总能耗的 86% 左右,但传统管理手段难以追踪实时。高昂的能源消耗不仅增加了运营成本,也给能源供应带来了巨大压力。 政策法规推动:       2021 年 10 月,《数据中心
    的头像 发表于 04-14 11:38 698次阅读
    如何破解<b class='flag-5'>数据中心</b><b class='flag-5'>能</b><b class='flag-5'>效</b>难题?该方案提供<b class='flag-5'>创新</b>策略

    是德科技推出AI数据中心构建器

    是德科技(NYSE:KEYS)推出Keysight AI (KAI)数据中心构建器,这是款先进的软件套件,通过模拟真实工作负载来评估新算法、组件
    的头像 发表于 04-07 11:06 808次阅读

    适用于数据中心AI时代的800G网络

    ,成为新AI数据中心的核心驱动力。 AI时代的两大数据中心AI工厂与
    发表于 03-25 17:35

    英飞凌针对AI数据中心推出先进的电池备份单元技术, 进一步完善Powering AI路线图

      新AI 数据中心电池备份单元 (BBU) 的推出体现了英飞凌树立 AI 供电新标准的承诺 该路线图包括全球首款 12 kW BBU
    发表于 03-14 11:09 465次阅读
    英飞凌针对<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b><b class='flag-5'>推出</b>先进的电池备份单元技术, <b class='flag-5'>进一步</b>完善Powering <b class='flag-5'>AI</b>路线图

    解锁数据中心效能密码:站式综合管理方案

    解锁数据中心效能密码:站式综合管理方案
    的头像 发表于 03-08 08:13 480次阅读
    解锁<b class='flag-5'>数据中心</b>效能密码:<b class='flag-5'>一</b>站式综合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理方案

    亚马逊科技Marketplace(中国区)正式支持专业服务产品

    规性评估、架构审查、应用程序组合/迁移评估、成本评估等)、技术支持服务,以及环境相关的托管式服务。通过此次发布,企业可在亚马逊科技Marketplace(中国区)
    发表于 02-28 13:42 329次阅读

    全新英特尔至强6处理器来袭,现代数据中心的性能与平衡“大师”

    英特尔进一步丰富至强6处理器产品组合,为行业提供多款满足广泛工作负载的CPU选择。 新闻亮点 · 英特尔推出全新英特尔® 至强® 6性能核处理器,以卓越性能和高达2倍¹的AI处理性能
    的头像 发表于 02-25 17:39 634次阅读

    曙光全面支持DeepSeek大模型

    近日,曙光正式宣布,全系列产品将全面支持DeepSeek。产品涵盖用于大型计算中心建设的曙光Stack
    的头像 发表于 02-14 09:24 819次阅读

    亚马逊科技发布Amazon Bedrock新功能

    (AI)应用程序。 此次发布不仅展示了亚马逊科技在模型选择方面的坚定承诺,还进一步优化了大规模推理的执行方式,为客户从海量数据中挖掘更多价
    的头像 发表于 12-25 15:52 764次阅读

    亚马逊科技与Adobe携手推出AEP解决方案

    ,助力其打造高度个性化的客户体验,进一步巩固客户关系。 AEP解决方案充分利用了亚马逊科技的强大计算能力和Adobe在数字体验领域的深厚积累。通过这
    的头像 发表于 12-25 15:44 837次阅读

    亚马逊科技发布全新数据中心组件

    设计等多个方面进行深度优化和创新,成功构建了个更加高效节能的数据中心。这些创新不仅提升数据中心
    的头像 发表于 12-24 15:05 809次阅读

    Amazon Bedrock推出多个新模型和全新强大的推理和数据处理功能

    :Invent全球大会上,宣布推出Amazon Bedrock的多项创新功能。Amazon Bedrock是亚马逊科技项完全托管的服务,
    的头像 发表于 12-07 19:31 1439次阅读
    Amazon Bedrock<b class='flag-5'>推出</b>多个新模型和<b class='flag-5'>全新</b>强大的推理和<b class='flag-5'>数据</b>处理功能