0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Neoverse与AWS Graviton4加速云计算创新

Arm社区 来源:Arm社区 2024-12-17 10:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 基础设施事业部服务器生态系统开发总监

Bhumik Patel

随着人工智能 (AI) 技术的迅猛发展,云计算领域正在经历显著变革。愈发复杂的 AI 应用对计算解决方案的性能、效率和成本效益提出了更高要求。在云端部署工作负载的客户正在重新评估其所需的基础设施,以满足现代工作负载需求,其中不仅包括提高性能和降低成本,还涵盖了需符合监管要求或可持续发展目标的新能效基准。

Arm 与亚马逊云科技 (AWS) 长期合作,为实现性能更强劲、更高效和可持续的云计算提供专用芯片和计算技术。在近期举行的 AWS re:Invent 2024 大会上,AWS 进一步展示了 AWS Graviton4 所取得的显著进展,使开发者和企业能够充分发挥其云工作负载的性能潜力。

卓越的性能表现

相较于上一代 Graviton3 处理器,基于 Arm Neoverse V2 平台的 AWS Graviton4 处理器在计算性能上提升了 30%,核心数增加了 50%,内存带宽提高了 75%。凭借这些技术优势,AWS Graviton 处理器在生态系统和客户群体中得到了广泛应用。

Arm Neoverse V2 平台涵盖 Armv9 架构的新特性,包括高性能浮点和向量指令支持,以及 SVE/SVE2、Bfloat16 和 INT8 MatMul 等特性。这些特性为 AI/机器学习 (ML) 以及高性能计算 (HPC) 工作负载提供了卓越性能。

AI/ML 工作负载

今年早些时候,Arm 与主流的 AI 框架和软件生态系统合作,推出了 Arm Kleidi 软件,以确保 Arm 平台上开机即用的推理性能优化能惠及整个 ML 栈,开发者无需掌握额外的 Arm 专业知识即可构建其工作负载,从而进一步推动 AI 工作负载的广泛应用。此前,我们已展示了 PyTorch 中的这些优化如何赋能 AWS Graviton4 上运行大语言模型 (LLM),如 Llama 3 70B 和 Llama 3.1 8B,并显著改善了每秒生成词元 (token) 数和词元首次响应时间的表现指标。

欢迎阅读《Arm KleidiAI 助力提升 PyTorch 上 LLM 推理性能》一文,详细了解性能指标的提升细节。

HPC 和 EDA 工作负载

对于 HPC 工作负载,Graviton4 相较于 Graviton3E 在功能上实现了显著提升。每个核心的主内存带宽增加了16%,每个 vCPU 的 L2 缓存容量翻倍。这些改进对于 HPC 应用的性能至关重要,因为 HPC 应用通常受限于内存带宽。AWS 已经在这些领域取得了显著优势,如下所示。

根据 Arm 工程团队实际运行 EDA 工作负载所得出的结果,Graviton4 提供的 RTL 仿真工作负载性能比 Graviton3 高出 37%。

生态系统广泛采用

近年来,随着云计算用户将各种云工作负载部署在 AWS Graviton 处理器上,其软件生态系统持续扩展。如此一来,客户不仅节省了费用,收获了性能的提升,还能优化其碳足迹和可持续发展足迹。以下是部分示例:

着手利用 Graviton 的强大性能

我们坚信 Arm 将在云计算的未来中发挥关键作用,同时我们也非常自豪能够支持 AWS Graviton 立于技术创新的前沿。Arm 将继续投入,进一步强化我们的软件生态系统,从而使开发者能够更加轻松地在 Arm 平台上构建其应用,并充分利用 Arm 计算平台所提供的卓越性能和效率优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20150

    浏览量

    247301
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9501

    浏览量

    388812
  • 云计算
    +关注

    关注

    39

    文章

    8003

    浏览量

    143125
  • AI
    AI
    +关注

    关注

    89

    文章

    38162

    浏览量

    296850

原文标题:Arm Neoverse 赋能 AWS Graviton4 处理器,加速云计算创新

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm Neoverse平台集成NVIDIA NVLink Fusion

    生态系统,实现全缓存一致性与高带宽互连。 随着 AI 数据中心对 Arm Neoverse 的需求持续增长,客户在将工作负载加速器连接至 Arm 平台时拥有更多选择。 人工智能 (A
    的头像 发表于 11-26 11:08 296次阅读

    亚马逊科技在中国区域推出Amazon Graviton4实例 以自研芯片驱动企业算力升级

    Graviton4处理器的Amazon Elastic Compute Cloud(Amazon EC2)C8g、M8g和R8g实例,针对客户不同类型的工作负载进行优化。与Amazon Graviton3处理器
    的头像 发表于 09-10 20:51 554次阅读

    西门子 Veloce CS 助力 Arm Neoverse 计算子系统验证与确认

    西门子数字化工业软件近日宣布,Veloce Strato CS 与Veloce proFPGA CS 已被 Veloce 的长期合作伙伴 Arm 部署应用,作为Arm Neoverse 计算
    的头像 发表于 08-06 09:26 2542次阅读

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    颇具优势。Arm 携手合作伙伴,在 Arm Neoverse N2 平台上使用开源推理框架 llama.cpp 实现 DeepSeek-R1 满血版的部署,目前已可提供线上服务。
    的头像 发表于 07-03 14:37 995次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> N2平台实现DeepSeek-R1满血版部署

    Arm携手微软共筑计算和PC未来

    计算平台并从中受益。无论是在 Microsoft Azure 的云端还是在 Windows on Arm PC 的边缘侧,开发者可以在任何地方加速其应用和工作负载。
    的头像 发表于 05-28 14:08 747次阅读

    解读基于Arm Neoverse V2平台的Google Axion处理器

    计算需求在人工智能 (AI) 时代的爆发式增长,推动了开发者寻求性能优化且高能效的解决方案,以降低总体拥有成本 (TCO)。Arm 致力于通过 Arm
    的头像 发表于 04-21 13:47 896次阅读

    Arm助力开发者加速迁移至Arm架构平台 Arm迁移资源分享

    随着基于 Arm 架构的实例日益扩展,越来越多的用户正从传统平台迁移至 Arm 平台上。
    的头像 发表于 04-09 18:23 1029次阅读

    Arm Neoverse CMN S3 推动Compute Express Link (CXL) 存储创新

    作者:Arm 物联网事业部产品经理 John Xavier Lionel 一致性网状网络 (Coherent Mesh Network, CMN) 互连是一种前沿技术,旨在为现代计算和存储架构提供
    发表于 04-09 18:19 1016次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CMN S3 推动Compute Express Link (CXL) 存储<b class='flag-5'>创新</b>

    如何在基于Arm Neoverse平台的CPU上构建分布式Kubernetes集群

    在本文中,我们将以 X(原 Twitter)为例,演示如何在基于 Arm Neoverse 平台的 CPU 上构建分布式 Kubernetes 集群,以根据推文实时监控情绪变化。如此一来,你可以充分利用 Arm
    的头像 发表于 03-25 15:58 662次阅读
    如何在基于<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>平台的CPU上构建分布式Kubernetes集群

    AWS Graviton4处理器上运行大语言模型的性能评估

    亚马逊科技 (AWS) 新一代基于 Arm 架构的定制 CPU —— AWS Graviton4 处理器已于 2024 年 7 月正式上线
    的头像 发表于 02-24 10:28 1245次阅读
    在<b class='flag-5'>AWS</b> <b class='flag-5'>Graviton4</b>处理器上运行大语言模型的性能评估

    Arm技术助力Google Axion处理器加速AI工作负载推理

    Arm Neoverse V2 平台赋能的 Google Axion 处理器已在 Google Cloud 上正式上线,其中,C4A 是首款基于 Axion 的虚拟机,为基于 C
    的头像 发表于 02-14 14:11 960次阅读
    <b class='flag-5'>Arm</b>技术助力Google Axion处理器<b class='flag-5'>加速</b>AI工作负载推理

    Arm平台引领AI计算革新

    我们正处于一个由人工智能 (AI) 定义的计算时代,其转型速度空前迅速。Arm 一直致力于通过工程创新和技术发展,以可持续且可扩展的方式加速 AI 未来。而这样的愿景也在
    的头像 发表于 01-03 15:26 1032次阅读

    Arm Neoverse 驱动 AWS Graviton4加速计算新时代

    满足性能提升、成本降低以及符合监管和可持续发展目标的新能效基准。 近日,Arm与亚马逊科技(AWS)的长期合作,正致力于通过专用芯片和计算技术,推动
    的头像 发表于 12-23 17:38 964次阅读

    强悍的AWS Graviton4处理器及其背后的Arm Neoverse

    Graviton4相较于上一代产品带来了巨大的性能提升。同时,为Graviton4赋能的Arm Neoverse也跟着受到了更多的关注。   强悍的
    的头像 发表于 12-19 00:04 2915次阅读

    ArmAWS合作深化,AWS Graviton4展现显著进展

    :Invent 2024大会上,AWS进一步展示了其基于Arm架构的AWS Graviton4处理器的显著进展。AWS
    的头像 发表于 12-18 14:17 851次阅读