0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC处理器的多核架构挑战

王燕 来源:十个名字V 作者:十个名字V 2022-07-14 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着半导体设计团队竞相利用“超越摩尔”,新的架构选择和挑战层出不穷。以超大规模硬件为例,其中一系列工作负载——数据库分析、人工智能、微服务、视频编码和高复杂性计算算法——需要一系列处理器解决方案。性能、功耗和成本仍然至关重要,但现在架构师自己交付。没有一种“最好”的架构;处理器必须设计为最好地服务于特定类别的工作负载和价格/性能配置文件。

多核架构挑战

AWS Graviton2 有 64 个 Arm Neoverse N1 内核,它们平铺在单个芯片上的连贯网状网络中。其他设计已经扩展到多芯片,芯片之间具有缓存一致的连接。多芯片实现为进一步增长和降低不太先进工艺成本的潜力开辟了空间。虽然这些新架构选项扩展了可能性,但它们也带来了新的设计挑战。在众多选择中,哪些架构真正能够以合适的价格为合适的工作负载提供更高的吞吐量?

这里的一个问题是,应如何针对目标类应用程序的物理内存对相干网状网络中的分布式系统缓存进行分区。优化这些选择,甚至优化哪些 CPU 内核最能满足需求,都需要以周期级精度运行实际工作负载。高级模型根本不足以达到此目的。

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

图:多芯片实现中不同的 I/O 延迟。(来源:Cadence

连贯网格中的处理器阵列之间的通信延迟在单个裸片内将相对一致,但在多裸片实现中裸片之间的延迟可能会有很大差异(见图)。因此,设计发展出多种架构,可在未来使用——全连接网格、集线器和辐条内存系统或其他 2D 和 3D 结构,其中一个小芯片提供大系统缓存和主内存访问。此外,堆栈中的其他小芯片相互通信,并通过集线器与主存储器通信。

有效探索所有这些选项在很大程度上取决于针对实际工作负载准确建模性能。建模和分析只能在 RTL 域中使用仿真和原型进行探索。

SystemReady 合规性

服务器架构师面临的另一种问题是操作系统兼容性。您可以直接在大多数笔记本电脑上启动任何 Linux 发行版、虚拟机管理程序或 Windows。要在基于 Arm 的服务器上启动,此责任由服务器制造商和 Arm 分担。

Arm 开发了一个名为 SystemReady 的合规套件,以标准化一组最低要求,以解决这个问题和其他合规问题。PCIe 合规性是一个特别重要的组件,因为它直接为许多服务器接口协议提供或作为主要 I/O 的基础,以实现快速存储、快速网络和芯片外连贯接口。这里特别重要的是通过 PCIe 进行远程服务器引导。Arm 将此合规套件作为在 UEFI (BIOS) 层上运行的软件提供。Cadence 与 Arm 合作了几年,旨在将测试缩减为具有 PCIe 流量生成库的最小裸机测试套件,该库的仿真速度比 UEFI 测试套件更快,可以快速调整硬件调试。

服务器开发人员面临的另一个挑战是 PCIe 使用强排序的内存模型。Arm 支持标准允许的松散排序的内存模型。但只有强排序才能保证没有死锁。在松散订购下,硬件/固件开发人员必须提供该保证。不幸的是,这无法通过合规性检查。集成商必须再次在仿真器或原型系统上通过广泛的用例测试证明设计是死锁安全的。

使用 Cadence System 验证 IP 的方法使工程师能够在半天内启动并运行系统级测试套件,该套件可以根据 SystemReady 要求验证 PCIe 集成。此方法还可用于演示从连接到 PCIe 的闪存设备模型引导 SUSE Linux 和 Windows,这引起了高级服务器社区的极大兴趣。

不仅适用于服务器

Arm Neoverse 平台不仅是为高端服务器设计的。该家族已经开始进入其他云应用程序和通信基础设施,一直到边缘。在其中一些应用程序中,多核架构已经很重要。在大多数此类应用程序(例如汽车)中,对一系列开放和商业操作系统的开箱即用支持是必不可少的。

我相信用于自动生成系统级内容和验证系统级目标合规性的工具将在许多市场中具有广泛的适用性。EDA 行业需要超越传统的单接口单协议验证 IP (VIP) 范围,走向多接口多协议系统级 VIP 的新时代。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20149

    浏览量

    247181
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388734
  • 服务器
    +关注

    关注

    13

    文章

    10093

    浏览量

    90886
  • HPC
    HPC
    +关注

    关注

    0

    文章

    342

    浏览量

    24825
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【老法师】多核异构处理器中M核程序的启动、编写和仿真

    有很多研究单片机的小伙伴在面对多核异构处理器时,可能会对多核的启动流程感到困惑——因为不熟悉GCC编程和GDB调试,所以也无法确定多核异构处理器
    的头像 发表于 08-13 09:05 3649次阅读
    【老法师】<b class='flag-5'>多核</b>异构<b class='flag-5'>处理器</b>中M核程序的启动、编写和仿真

    T113-i芯片技术解析:高性能嵌入式处理器的创新设计

     芯片概述 明远智睿的T113-i芯片是一款由全志科技推出的高性能、低功耗嵌入式处理器,主要面向智能家居、工业控制、消费电子等领域。该芯片基于ARM架构,集成了多核CPU、GPU和丰富的接口资源,在
    的头像 发表于 07-17 14:15 851次阅读

    龙芯处理器支持WINDOWS吗?

    龙芯处理器目前不支持原生运行Windows操作系统,主要原因如下: 架构差异 龙芯架构:龙芯早期基于MIPS架构,后续转向自主研发的LoongArch指令集(与x86/ARM不兼容
    发表于 06-05 14:24

    HPM5E31IGN单核 32 位 RISC-V 处理器

    问题。其单核设计在保证性能的同时实现了优异的能效比,主频可达248MHz,远超同类ARM架构处理器。这种高性能特性使其能够轻松应对实时数据处理、复杂算法运算等挑战性任务。核心特性
    发表于 05-29 09:23

    技术分享 | 如何在2k0300(LoongArch架构处理器上跑通qt开发流程

    技术分享 | 如何在2k0300开发板(LoongArch架构处理器上跑通qt开发流程
    的头像 发表于 05-20 11:05 656次阅读
    技术分享 | 如何在2k0300(LoongArch<b class='flag-5'>架构</b>)<b class='flag-5'>处理器</b>上跑通qt开发流程

    热成像仪为何都在疯狂卷多核处理器?“多核大战”背后的真相你知道吗?

    ”远远不够, “看得清”“不卡顿”“多任务并行”成了刚需。 于是,一场关于“多核处理器”的行业竞赛悄然拉开帷幕。 多核,不只是手机的事,热成像仪也在“追核” 过去我们常常听说手机从双核进化到八核甚至二十核,现在同样的逻辑正发生在
    的头像 发表于 04-27 15:41 563次阅读

    端侧 AI 音频处理器:集成音频处理与 AI 计算能力的创新芯片

    对人工智能应用日益增长的需求。   集成音频处理与 AI 计算能力 端侧 AI 音频处理器的组成结构通常较为复杂,常采用多核异构架构,将不同类型的
    的头像 发表于 02-16 00:13 3066次阅读

    康佳特推出高性能COM-HPC模块conga-HPC/cBLS

    应用而设计,旨在满足现代工业对高性能、高可靠性和灵活性的需求。 conga-HPC/cBLS模块属于COM-HPC Client Size C(120x160 mm)规格,搭载了英特尔酷睿S系列处理器(代号
    的头像 发表于 02-08 16:49 905次阅读

    低功耗处理器的优势分析

    就考虑到能耗问题,通过优化架构、工艺和软件来降低功耗的处理器。它们通常采用先进的制造工艺,如FinFET或GAAFET技术,以及高效的电源管理技术,以实现在保持性能的同时减少能耗。 低功耗处理器的优势 1. 节能和环保 减少能源
    的头像 发表于 02-07 09:14 1797次阅读

    康佳特发布高性能COM-HPC模块

    嵌入式解决方案的日益增长需求。 conga-HPC/cBLS模块是一款COM-HPC Client Size C(120x160 mm)规格的计算机模块,它基于英特尔酷睿S系列处理器(代号
    的头像 发表于 02-05 18:21 1237次阅读

    HPC云计算的技术架构

    HPC云计算结合了HPC的强大计算能力和云计算的弹性、可扩展性,为用户提供了按需获取高性能计算资源的便利。下面,AI部落小编带您了解HPC云计算的技术架构
    的头像 发表于 02-05 14:51 691次阅读

    康佳特推出全新COM-HPC模块

    德国领先的嵌入式和边缘计算技术供应商康佳特,近日宣布扩展其高性能COM-HPC计算机模块产品线,推出了全新的conga-HPC/cBLS模块。该模块专为需要强大计算能力的边缘与基础设施应用而设计,采用了英特尔酷睿S系列处理器(代
    的头像 发表于 01-23 15:33 1210次阅读

    Andes晶心科技推出AndesCore AX66乱序超纯量多核处理器IP

    Andes晶心科技(Andes Technology)作为高效能、低功耗、32/64位RISC-V处理器核的领先供货商及RISC-V国际组织的创始顶级会员,今日宣布推出支持RVA23规范的AndesCore AX66乱序超纯量多核处理器
    的头像 发表于 01-23 11:05 1645次阅读

    QorIQ®T1042多核处理器

    QorIQ®T1042多核处理器T1042 QorIQ高级多核处理器综合了数据网络、电信/数据通讯、无线网络基础设施和国防军事/航天工程应用所需要的性能卓越数据线路加速及网络和外围总线
    发表于 01-10 08:48

    云计算HPC软件关键技术

    云计算HPC软件关键技术涉及系统架构处理器技术、操作系统、计算加速、网络技术以及软件优化等多个方面。下面,AI部落小编带您探讨云计算HPC软件的关键技术。
    的头像 发表于 12-18 11:23 798次阅读