0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HPC处理器的多核架构挑战

王燕 来源:十个名字V 作者:十个名字V 2022-07-14 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着半导体设计团队竞相利用“超越摩尔”,新的架构选择和挑战层出不穷。以超大规模硬件为例,其中一系列工作负载——数据库分析、人工智能、微服务、视频编码和高复杂性计算算法——需要一系列处理器解决方案。性能、功耗和成本仍然至关重要,但现在架构师自己交付。没有一种“最好”的架构;处理器必须设计为最好地服务于特定类别的工作负载和价格/性能配置文件。

多核架构挑战

AWS Graviton2 有 64 个 Arm Neoverse N1 内核,它们平铺在单个芯片上的连贯网状网络中。其他设计已经扩展到多芯片,芯片之间具有缓存一致的连接。多芯片实现为进一步增长和降低不太先进工艺成本的潜力开辟了空间。虽然这些新架构选项扩展了可能性,但它们也带来了新的设计挑战。在众多选择中,哪些架构真正能够以合适的价格为合适的工作负载提供更高的吞吐量?

这里的一个问题是,应如何针对目标类应用程序的物理内存对相干网状网络中的分布式系统缓存进行分区。优化这些选择,甚至优化哪些 CPU 内核最能满足需求,都需要以周期级精度运行实际工作负载。高级模型根本不足以达到此目的。

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

图:多芯片实现中不同的 I/O 延迟。(来源:Cadence

连贯网格中的处理器阵列之间的通信延迟在单个裸片内将相对一致,但在多裸片实现中裸片之间的延迟可能会有很大差异(见图)。因此,设计发展出多种架构,可在未来使用——全连接网格、集线器和辐条内存系统或其他 2D 和 3D 结构,其中一个小芯片提供大系统缓存和主内存访问。此外,堆栈中的其他小芯片相互通信,并通过集线器与主存储器通信。

有效探索所有这些选项在很大程度上取决于针对实际工作负载准确建模性能。建模和分析只能在 RTL 域中使用仿真和原型进行探索。

SystemReady 合规性

服务器架构师面临的另一种问题是操作系统兼容性。您可以直接在大多数笔记本电脑上启动任何 Linux 发行版、虚拟机管理程序或 Windows。要在基于 Arm 的服务器上启动,此责任由服务器制造商和 Arm 分担。

Arm 开发了一个名为 SystemReady 的合规套件,以标准化一组最低要求,以解决这个问题和其他合规问题。PCIe 合规性是一个特别重要的组件,因为它直接为许多服务器接口协议提供或作为主要 I/O 的基础,以实现快速存储、快速网络和芯片外连贯接口。这里特别重要的是通过 PCIe 进行远程服务器引导。Arm 将此合规套件作为在 UEFI (BIOS) 层上运行的软件提供。Cadence 与 Arm 合作了几年,旨在将测试缩减为具有 PCIe 流量生成库的最小裸机测试套件,该库的仿真速度比 UEFI 测试套件更快,可以快速调整硬件调试。

服务器开发人员面临的另一个挑战是 PCIe 使用强排序的内存模型。Arm 支持标准允许的松散排序的内存模型。但只有强排序才能保证没有死锁。在松散订购下,硬件/固件开发人员必须提供该保证。不幸的是,这无法通过合规性检查。集成商必须再次在仿真器或原型系统上通过广泛的用例测试证明设计是死锁安全的。

使用 Cadence System 验证 IP 的方法使工程师能够在半天内启动并运行系统级测试套件,该套件可以根据 SystemReady 要求验证 PCIe 集成。此方法还可用于演示从连接到 PCIe 的闪存设备模型引导 SUSE Linux 和 Windows,这引起了高级服务器社区的极大兴趣。

不仅适用于服务器

Arm Neoverse 平台不仅是为高端服务器设计的。该家族已经开始进入其他云应用程序和通信基础设施,一直到边缘。在其中一些应用程序中,多核架构已经很重要。在大多数此类应用程序(例如汽车)中,对一系列开放和商业操作系统的开箱即用支持是必不可少的。

我相信用于自动生成系统级内容和验证系统级目标合规性的工具将在许多市场中具有广泛的适用性。EDA 行业需要超越传统的单接口单协议验证 IP (VIP) 范围,走向多接口多协议系统级 VIP 的新时代。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20333

    浏览量

    255023
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9588

    浏览量

    393678
  • 服务器
    +关注

    关注

    14

    文章

    10362

    浏览量

    91759
  • HPC
    HPC
    +关注

    关注

    0

    文章

    350

    浏览量

    25073
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MPC180LMB安全处理器:功能、架构与应用全解析

    MPC180LMB安全处理器:功能、架构与应用全解析 在当今数字化时代,网络安全至关重要,安全处理器在保障数据安全方面发挥着关键作用。Freescale Semiconductor
    的头像 发表于 04-10 11:30 152次阅读

    探索ADSP - 21371/ADSP - 21375 SHARC处理器:高性能音频处理的利器

    探索ADSP - 21371/ADSP - 21375 SHARC处理器:高性能音频处理的利器 在电子设计领域,处理器的性能和特性直接影响着产品的功能和竞争力。ADSP - 21371/ADSP
    的头像 发表于 03-23 16:35 687次阅读

    SMJ320C80数字信号处理器架构、特性与应用全解析

    SMJ320C80数字信号处理器架构、特性与应用全解析 在当今数字化的时代,数字信号处理器(DSP)在众多领域中发挥着至关重要的作用。SMJ320C80作为一款高性能的单芯片并行处理器
    的头像 发表于 03-06 16:55 1117次阅读

    探索TDA54x Jacinto™处理器:高性能与安全的完美融合

    我们带来了哪些新的技术亮点和应用可能。 文件下载: tda54-q1.pdf 强大的功能特性 多核处理架构 TDA54x处理器拥有丰富的处理
    的头像 发表于 03-06 16:50 1160次阅读

    MAX77874:16A高性能四相降压调节,引领多核处理器电源解决方案

    MAX77874:16A高性能四相降压调节,引领多核处理器电源解决方案 在电子设备飞速发展的今天,多核心CPU和GPU处理器对电源的要求
    的头像 发表于 03-06 16:40 1088次阅读

    TAS3103A数字音频处理器:特性、架构与应用详解

    TAS3103A数字音频处理器:特性、架构与应用详解 引言 在当今数字化音频处理领域,一款高性能、可配置的音频处理器至关重要。德州仪器(Texas Instruments)的TAS31
    的头像 发表于 02-27 16:25 291次阅读

    Chiplet,如何助力HPC

    (chipletarchitecture),它能够以更低的成本提供比单芯片处理器更高的性能,同时能耗降低高达10倍。这些优势使得小芯片架构在未来高性能计算和人工智
    的头像 发表于 02-26 15:15 874次阅读
    Chiplet,如何助力<b class='flag-5'>HPC</b>?

    云拼接处理器的性能如何?

    性能方面表现卓越,以下从多个维度进行深入解析。 一、硬件设计:稳定与高效的基石 融大视觉的云拼接处理器采用嵌入式纯硬件设计,这一设计理念使其区别于依赖操作系统的软件方案。由于没有传统操作系统的复杂架构,系统完
    的头像 发表于 09-05 00:11 881次阅读

    Andes晶心科技推出AndesCore 46系列处理器家族

    Andes晶心科技,作为高效能、低功耗32/64位RISC-V处理器核的领导供货商及RISC-V国际组织的创始首席会员,今日宣布推出具有4个成员的AndesCore 46系列处理器家族。首款成员AX46MPV是一款全新64位多核
    的头像 发表于 08-13 14:02 2986次阅读

    【老法师】多核异构处理器中M核程序的启动、编写和仿真

    有很多研究单片机的小伙伴在面对多核异构处理器时,可能会对多核的启动流程感到困惑——因为不熟悉GCC编程和GDB调试,所以也无法确定多核异构处理器
    的头像 发表于 08-13 09:05 4200次阅读
    【老法师】<b class='flag-5'>多核</b>异构<b class='flag-5'>处理器</b>中M核程序的启动、编写和仿真

    T113-i芯片技术解析:高性能嵌入式处理器的创新设计

     芯片概述 明远智睿的T113-i芯片是一款由全志科技推出的高性能、低功耗嵌入式处理器,主要面向智能家居、工业控制、消费电子等领域。该芯片基于ARM架构,集成了多核CPU、GPU和丰富的接口资源,在
    的头像 发表于 07-17 14:15 1533次阅读

    龙芯处理器支持WINDOWS吗?

    龙芯处理器目前不支持原生运行Windows操作系统,主要原因如下: 架构差异 龙芯架构:龙芯早期基于MIPS架构,后续转向自主研发的LoongArch指令集(与x86/ARM不兼容
    发表于 06-05 14:24

    HPM5E31IGN单核 32 位 RISC-V 处理器

    问题。其单核设计在保证性能的同时实现了优异的能效比,主频可达248MHz,远超同类ARM架构处理器。这种高性能特性使其能够轻松应对实时数据处理、复杂算法运算等挑战性任务。核心特性
    发表于 05-29 09:23

    技术分享 | 如何在2k0300(LoongArch架构处理器上跑通qt开发流程

    技术分享 | 如何在2k0300开发板(LoongArch架构处理器上跑通qt开发流程
    的头像 发表于 05-20 11:05 1020次阅读
    技术分享 | 如何在2k0300(LoongArch<b class='flag-5'>架构</b>)<b class='flag-5'>处理器</b>上跑通qt开发流程

    热成像仪为何都在疯狂卷多核处理器?“多核大战”背后的真相你知道吗?

    ”远远不够, “看得清”“不卡顿”“多任务并行”成了刚需。 于是,一场关于“多核处理器”的行业竞赛悄然拉开帷幕。 多核,不只是手机的事,热成像仪也在“追核” 过去我们常常听说手机从双核进化到八核甚至二十核,现在同样的逻辑正发生在
    的头像 发表于 04-27 15:41 942次阅读