0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Neoverse与AWS Graviton4加速云计算创新

Arm社区 来源:Arm社区 2024-12-17 10:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 基础设施事业部服务器生态系统开发总监

Bhumik Patel

随着人工智能 (AI) 技术的迅猛发展,云计算领域正在经历显著变革。愈发复杂的 AI 应用对计算解决方案的性能、效率和成本效益提出了更高要求。在云端部署工作负载的客户正在重新评估其所需的基础设施,以满足现代工作负载需求,其中不仅包括提高性能和降低成本,还涵盖了需符合监管要求或可持续发展目标的新能效基准。

Arm 与亚马逊云科技 (AWS) 长期合作,为实现性能更强劲、更高效和可持续的云计算提供专用芯片和计算技术。在近期举行的 AWS re:Invent 2024 大会上,AWS 进一步展示了 AWS Graviton4 所取得的显著进展,使开发者和企业能够充分发挥其云工作负载的性能潜力。

卓越的性能表现

相较于上一代 Graviton3 处理器,基于 Arm Neoverse V2 平台的 AWS Graviton4 处理器在计算性能上提升了 30%,核心数增加了 50%,内存带宽提高了 75%。凭借这些技术优势,AWS Graviton 处理器在生态系统和客户群体中得到了广泛应用。

Arm Neoverse V2 平台涵盖 Armv9 架构的新特性,包括高性能浮点和向量指令支持,以及 SVE/SVE2、Bfloat16 和 INT8 MatMul 等特性。这些特性为 AI/机器学习 (ML) 以及高性能计算 (HPC) 工作负载提供了卓越性能。

AI/ML 工作负载

今年早些时候,Arm 与主流的 AI 框架和软件生态系统合作,推出了 Arm Kleidi 软件,以确保 Arm 平台上开机即用的推理性能优化能惠及整个 ML 栈,开发者无需掌握额外的 Arm 专业知识即可构建其工作负载,从而进一步推动 AI 工作负载的广泛应用。此前,我们已展示了 PyTorch 中的这些优化如何赋能 AWS Graviton4 上运行大语言模型 (LLM),如 Llama 3 70B 和 Llama 3.1 8B,并显著改善了每秒生成词元 (token) 数和词元首次响应时间的表现指标。

欢迎阅读《Arm KleidiAI 助力提升 PyTorch 上 LLM 推理性能》一文,详细了解性能指标的提升细节。

HPC 和 EDA 工作负载

对于 HPC 工作负载,Graviton4 相较于 Graviton3E 在功能上实现了显著提升。每个核心的主内存带宽增加了16%,每个 vCPU 的 L2 缓存容量翻倍。这些改进对于 HPC 应用的性能至关重要,因为 HPC 应用通常受限于内存带宽。AWS 已经在这些领域取得了显著优势,如下所示。

根据 Arm 工程团队实际运行 EDA 工作负载所得出的结果,Graviton4 提供的 RTL 仿真工作负载性能比 Graviton3 高出 37%。

生态系统广泛采用

近年来,随着云计算用户将各种云工作负载部署在 AWS Graviton 处理器上,其软件生态系统持续扩展。如此一来,客户不仅节省了费用,收获了性能的提升,还能优化其碳足迹和可持续发展足迹。以下是部分示例:

着手利用 Graviton 的强大性能

我们坚信 Arm 将在云计算的未来中发挥关键作用,同时我们也非常自豪能够支持 AWS Graviton 立于技术创新的前沿。Arm 将继续投入,进一步强化我们的软件生态系统,从而使开发者能够更加轻松地在 Arm 平台上构建其应用,并充分利用 Arm 计算平台所提供的卓越性能和效率优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20329

    浏览量

    254825
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9588

    浏览量

    393556
  • 云计算
    +关注

    关注

    39

    文章

    8041

    浏览量

    144750
  • AI
    AI
    +关注

    关注

    91

    文章

    41050

    浏览量

    302559

原文标题:Arm Neoverse 赋能 AWS Graviton4 处理器,加速云计算创新

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞萨RX65N套件AWS连接演示快速上手指南

    瑞萨RX65N套件AWS连接演示快速上手指南 在物联网应用日益广泛的今天,瑞萨RX65N套件为开发者提供了一个便捷的平台来实现设备与
    的头像 发表于 04-13 16:00 77次阅读

    Arm Neoverse计算平台驱动AI基础设施开启全新纪元

    十余年来,计算依托抽象化架构实现规模化扩展。标准化服务器、虚拟化资源与通用型基础设施,让超大规模服务提供商得以在同质化硬件基础上持续叠加软件创新,实现高速增长。而这个时代,已然落幕
    的头像 发表于 03-03 10:24 567次阅读

    意法半导体与亚马逊计算服务深化战略合作

    ‍‍‍‍‍‍‍‍ 意法半导体(ST)近日宣布与亚马逊计算服务(AWS)拓展战略协作,达成一项为期多年、价值数十亿美元的商业协议,涵盖多个产品类别。通过此次合作,意法半导体将成为AWS
    的头像 发表于 02-28 11:46 504次阅读

    如何在Arm Neoverse N2平台上提升llama.cpp扩展性能

    跨 NUMA 内存访问可能会限制 llama.cpp 在 Arm Neoverse 平台上的扩展能力。本文将为你详细分析这一问题,并通过引入原型验证补丁来加以解决。测试结果表明,在基于 Neoverse N2 平台的系统上运行
    的头像 发表于 02-11 10:06 303次阅读

    AWS安全入门:数据上前必知的基础防线

    前言智能废料分拣系统在工厂边缘运行,通过AWS服务将分拣准确率从70%提升至97%,背后是一套完整的云安全体系在默默守护。亚马逊科技作为全球领先的
    的头像 发表于 01-07 13:43 1387次阅读
    <b class='flag-5'>AWS</b>安全入门:数据上<b class='flag-5'>云</b>前必知的基础防线

    融合创新计算架构的全面解析与应用

    在当今数字化的时代,计算已经成为推动企业创新和发展的关键技术。随着企业需求的多样化和技术环境的不断变化,单一的计算模式已无法满足企业对灵
    的头像 发表于 12-23 14:17 475次阅读

    西门子EDA与Arm携手合作加速系统设计验证进程与软件启动

    对芯片设计而言,加速产品的上市流程至关重要。为此,西门子EDA与Arm携手合作,为Arm的合作伙伴提供了一系列基于Arm Neoverse
    的头像 发表于 12-19 09:06 862次阅读
    西门子EDA与<b class='flag-5'>Arm</b>携手合作<b class='flag-5'>加速</b>系统设计验证进程与软件启动

    NVIDIA和AWS扩展全栈合作伙伴关系

    亚马逊科技(AWS)将 NVIDIA NVLink Fusion 集成到其定制芯片中,包括新一代 Tranium4 芯片、GravitonA
    的头像 发表于 12-13 09:20 1106次阅读

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    生态系统,实现全缓存一致性与高带宽互连。 随着 AI 数据中心对 Arm Neoverse 的需求持续增长,客户在将工作负载加速器连接至 Arm 平台时拥有更多选择。 人工智能 (A
    的头像 发表于 11-26 11:08 574次阅读

    如何使用 ARM FPU 加速浮点计算

    文件名): -none-objdump -d build-fpu.elf/usart1-test 同样,在反汇编文件中即可找到浮点计算代码: 三、使用 ARM FPU 加速浮点计算
    发表于 11-19 06:51

    亚马逊科技在中国区域推出Amazon Graviton4实例 以自研芯片驱动企业算力升级

    Graviton4处理器的Amazon Elastic Compute Cloud(Amazon EC2)C8g、M8g和R8g实例,针对客户不同类型的工作负载进行优化。与Amazon Graviton3处理器
    的头像 发表于 09-10 20:51 898次阅读

    西门子 Veloce CS 助力 Arm Neoverse 计算子系统验证与确认

    西门子数字化工业软件近日宣布,Veloce Strato CS 与Veloce proFPGA CS 已被 Veloce 的长期合作伙伴 Arm 部署应用,作为Arm Neoverse 计算
    的头像 发表于 08-06 09:26 3048次阅读

    Tata Communications与AWS达成合作

    的高容量弹性长途网络,以推动生成式AI应用和计算创新在印度的发展。 这一合作将成为Tata Communications在印度实施的规模最大、覆盖范围最广、带宽最高的网络部署项目之一。 AW
    的头像 发表于 07-30 21:47 1440次阅读

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 1420次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> N2平台实现DeepSeek-R1满血版部署

    Arm携手微软共筑计算和PC未来

    计算平台并从中受益。无论是在 Microsoft Azure 的云端还是在 Windows on Arm PC 的边缘侧,开发者可以在任何地方加速其应用和工作负载。
    的头像 发表于 05-28 14:08 1051次阅读