0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Neoverse V1–性能分析和遥测规范的自顶向下方法

jf_9aVl32Dp 来源:Arm软件开发者 2023-03-02 13:48 次阅读

Arm Neoverse V1 性能分析方法白皮书(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)现在可以下载了,它可以帮助您为基于V1的产品系统优化应用程序代码

白皮书是对上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵盖了从N1到V1内核的新功能和更新。此资源可用于了解和优化V1平台上应用程序的性能。

为了充分利用您花费的分析和优化时间,选择正确的PMU事件并遵循具有用户友好软件度量的结构化方法是非常重要的。在白皮书中,我们介绍了Neoverse V1的Arm自顶向下分析方法。

在本博客中,我们概述了从N1到V1内核的更新,并概述了本白皮书的内容。我们还引用了其他有用的资源,以充分利用Neoverse V1平台。

ArmNeoverse V1支持自上而下的1级指标。

Arm Neoverse V1平台是第一个Arm核心,为自上而下的方法学1级指标支持全套事件和指标。这些指标对于性能分析和优化是一个巨大的增值。

这些指标提供了SLOT级别处理器流水线利用率的详细细分,从而能够评估处理器效率和识别瓶颈。该功能是Arm Neoverse V1平台性能分析功能的一个主要增强,此外还有其他可用于进一步分析的微架构探索指标。

Arm Neoverse V1遥测规范:性能分析的事件和指标。

Arm Neoverse V1遥测规范,包括软件产品特定事件描述和衍生分析指标,可在Arm Neovere V1性能分析方法白皮书附录B和C中找到。

Arm遥测解决方案库

白皮书中引用的机器可读JSON文件中提供的遥测数据和压力工作负载套件现在可以在GitLab遥测解决方案库(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。

Neoverse V1 PMU事件和指标备忘单

在这个过程中,熟悉Arm Neoverse微体系结构,包括其复杂的管道和多级内存层次结构,可能会有所帮助。由于Neoverse内核提供了100多个硬件计数器可供选择,因此确定重点关注的事件的优先级非常重要。为了帮助完成这项任务,我们创建了列出事件及其相应派生度量的备忘单。

5d7bda8a-b06d-11ed-bfe3-dac502259ad0.jpg

表1。Neoverse V1核心活动备忘单

主要参考文献

以下两份文件提供了对Neoverse V1进行性能分析所需的所有信息,是我们推荐的参考文件:

1) Arm Neoverse V1性能分析方法白皮书(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮书介绍了一种性能分析方法,并介绍了如何在Arm Neovere V1平台上进行工作负载表征。这是对上一篇Neoverse N1白皮书的更新,该白皮书介绍了性能分析方法,并展示了如何在Arm Neoverse N1平台上进行工作负载表征。如果您是Arm平台和性能分析工具(如Linuxperf)的新手,我们建议您先阅读本白皮书。

2) Arm Neoverse V1 PMU指南(直接下载):本文档全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架构和架构细节。

Arm Neoverse V1核心

Arm Neoverse V1是一个核心,旨在为苛刻的云、HPC和AI/ML辅助工作负载提供最大的单线程性能。Neoverse V1是第一个包含可扩展向量扩展(SVE)的Neoverse处理器,可实现最大向量性能、HPC代码重用和使用寿命。Neoverse V1支持Bfloat16和Int8 MatMul指令。与Neoverse N1相比,这些指令可以为TensorFlow、PyTorch、OneDNN等机器学习框架提供高达3倍的性能。Neoverse V1 CPU目前可用于AWS EC2实例,由AWS Graviton3和AWS Graviton 3E处理器提供支持。

结论

我们自上而下的方法分析和遥测规范现在可用于Neoverse V1平台。我们将很快开始将这些信息上传到Linux perf工具。V系列内核,如V1,旨在在Neoverse系列CPU IP中提供最大的单线程性能。Neoverse V1性能分析方法白皮书和V1 PMU指南可以帮助开发人员从V1架构中获得最大性能。我们鼓励所有使用基于V1的平台(包括AWS Graviton3和Graviton3E)的开发人员学习和使用它。

白皮书下载地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18275

    浏览量

    222146
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8651

    浏览量

    361777
  • 应用程序
    +关注

    关注

    37

    文章

    3136

    浏览量

    56389

原文标题:Arm Neoverse V1–性能分析和遥测规范的自顶向下方法

文章出处:【微信号:Arm软件开发者,微信公众号:Arm软件开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Arm Neoverse家族新增V1和N2两大平台,突破高性能计算瓶颈

    带来 50%和 40%的性能提升。此外,Arm也同时发布了CMN-700,作为构建基于Neoverse V1和 N2 平台高性能SoC的关键
    的头像 发表于 04-30 16:20 8624次阅读

    基于向下技术的工程机械Digital Prototyping设计方法及应用

    【作者】:刘雪冬【来源】:《华南理工大学》2009年【摘要】:向下的设计方法及装配建模技术是在消费品行业应用比较成熟的一种设计方法和理论
    发表于 04-24 09:20

    如何实现扩频通信调制器向下的设计?

    如何实现扩频通信调制器向下的设计?如何实现扩频通信调制器的仿真测试?
    发表于 04-29 06:46

    ARM Neoverse IP的AWS实例上etcd分布式键对值存储性能提升

    1、基于ARM Neoverse IP的AWS实例上etcd性能提升etcd是一个分布式键值对存储,设计用来可靠而快速的保存关键数据并提供给分布式系统访问,尤其被当前最流行的容器编排
    发表于 07-06 17:37

    Arm Neoverse V1的AWS Graviton3在深度学习推理工作负载方面的作用

    ) 与 AWS Graviton2 (c6g) 的性能特点AWS Graviton3 (c7g) 引入了 Arm Neoverse V1 CPU,与 AWS Graviton2 (c6
    发表于 08-31 15:03

    ARM Neoverse N1 Core性能分析方法

    使用Neoverse N1 CPU上的性能监测单元(PMU)功能来确定和消除性能瓶颈的工作负载表征方法。目标受众是从事软件优化、调优和开发的
    发表于 08-09 06:01

    Arm Neoverse V1 PMU指南

    ®体系结构参考手册。有关Neoverse V1的更多详细描述,请请参阅Arm®NeoverseV1技术参考手册。 本文档不讨论使用软件开
    发表于 08-09 07:30

    Arm Neoverse N1软件优化指南

    本文档提供了有关Neoverse N1管道、指令性能特征和特殊性能注意事项的高级信息。此信息旨在帮助优化Neoverse N
    发表于 08-11 06:56

    Arm Neoverse V2参考设计版本C技术概述

    的电源、性能和面积(PPA)目标和其他关键要求。 RD-V2提供以下功能: ·32个MP1 ARMv9.0-A ARM®Neoverse
    发表于 08-11 07:54

    Arm Neoverse V1软件优化指南

    执行 Armv8-A 架构的Neovevev V1核心是一个高性能和低功率武器产品。 Neoveve V1核心支持 : 全面实施 Armv8.4-A A 64、A32和T32 指令组,其中不包括以下
    发表于 08-11 06:54

    Arm Neoverse™ N1 PMU指南

    ARMv8-A。 有关Neoverse N1的更多详细说明,请参阅ARM®Neoverse™N1技术参考手册。 本文档不讨论使用软件开发工具
    发表于 08-12 07:10

    Arm NeoverseV1软件优化指南

    Neovevy V1核心是一个高性能和低功率武器产品,用于实施Armv8-A结构。Neovy V1核心支持: 全面实施Armv8.4-A A64、A32和T32指令组,其中不包括以下特性: o
    发表于 08-25 08:03

    ARM Neoverse™N1核心技术参考手册

    Neoverse™N1内核是一款高性能、低功耗的ARM产品,采用ARM®V8-A架构。
    发表于 08-29 08:05

    ARM NeoverseV1参考设计软件开发人员指南

    支持两种RD-V1配置: ·RD-V1 FVP型号配置-M,这是一款单芯片系统,具有16个ARM®NeoverseV1内核。 ·RD-
    发表于 08-29 06:59

    互联网巨头纷纷启用Arm CPU架构,Arm最新Neoverse V1和N2平台加速云服务器芯片自研

    V1平台。 NeoverseN2 和V1,较N1性能分别提升40%和50% Neoverse V1作为V系列的第一个平台,与N1相比,其单
    发表于 09-30 14:46 1004次阅读