0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单个芯片性能提升的有效途径

奇异摩尔 来源:奇异摩尔 2024-10-23 15:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

单个芯片性能提升的有效途径

随着半导体制程不断逼近物理极限,越来越多的芯片厂商为了提升芯片性能和效率开始使用Chiplet技术,将多个满足特定功能的芯粒单元通过Die-to-Die互联技术与底层基础芯片封装在一起,形成一个系统级芯片。

c3acac06-90fb-11ef-a511-92fbcf53809c.png

在单个芯片内部,基于Chiplet架构的IO Die、Die-to-Die互联技术是增强单个芯片性能和性价比的关键途径。片内的高速互联可以大大降低数据传输的延迟和功耗。通过高速的内部互联,不同的功能模块可以快速共享数据,优化内存访问和计算资源的分配,提高整体能效比。简而言之,Chiplet架构下的内部高速互联,为芯片算力的提升开辟了新的可能。

AMD EPYC Zen 5系列Chiplet案例

c3bf762e-90fb-11ef-a511-92fbcf53809c.png

(Source:AMD 5th Gen EPYC 处理器白皮书)

近期才发布的AMD 代号为“Turin” Zen 5 架构的 EPYC 服务器处理器,使用台积电3nm/4nm工艺制造,主频高达5Ghz。Turin 有两种版本:一种配备Zen 5 内核(支持多达128内核、256线程),另一种配备 Zen 5c内核(支持多达192内核,384线程)。AMD继续沿用了Central IOD(IO Die)的设计架构,保持了上一代6nm的工艺。

c3d44d74-90fb-11ef-a511-92fbcf53809c.png

(Source:AMD 5th Gen EPYC 处理器白皮书)

上图所示,AMD运用Chiplet技术将CPU与IO Die创新路径解耦,这些芯片可以按照自己的制程进行开发及演进。通过模块化方法,可以灵活扩充/搭配CCD (CPU Die) 和IO Die,以创建满足工作负载需求的专业处理器。(按需配置低配版8内核到高配版192内核的处理器)。

随着CPU性能的提升,IO Die 也在不断发展以适应需求,更多的内核需要更多的I/O带宽从而支持12个DDR5-6000内存控制器、PCIe Gen 5 I/O以及AMD Infinity Fabric互连。

随着系统规模的不断扩大,我们需要将众多不同的小单元(如计算单元、存储单元、功能单元等)整合成更大规模的系统。为此,迫切需要一种从芯片内部到整个系统层面的统一互联架构。虽然国际顶尖厂商已经推出了各自的解决方案,但行业的发展趋势表明,厂商之间的合作已成为主流。因此,实现不同厂商间的互操作性变得至关重要。这就要求我们构建一个基于第三方产品的统一互联架构,以及开放的标准和生态系统。通过这种分工协作的模式,我们可以打造一个开放且繁荣的生态系统,使得各厂商能够根据自己的专长(如计算、软件开发、接口技术等)进行有效合作,共同推动行业的进步。

Die-to-Die片内互联:UCIe互联标准

Die-to-Die 互联是Chiplet架构的核心基础,它为芯片内部不同Die之间的紧密协作提供了传输的接口。Universal Chiplet Interconnect Express (UCIe) 是一种开放的行业互联标准,可在 Chiplet 之间提供高带宽、低延迟、节能且经济高效的封装内连接。

自2012年成立以来,UCIe 的既定目标是为Chiplet建立一个开放且无处不在的生态系统。无论这意味着简单地将某些物理方面标准化以简化制造,还是实现真正的混合匹配设置。在这样的生态系统中,客户可以自由地从多家芯片制造商那里挑选使用Chiplet构建的芯片模块,而这些都需要一个强大的基础标准来支撑。

UCIe技术被用于连接多个芯片Die、内存控制器和其他计算资源,形成一个高度集成的系统。这种集成方式允许不同的计算单元之间通过高速的数据通道进行通信,从而提高整体系统的处理能力和效率。此外,使用UCIe技术还可以实现动态功耗管理,通过在不同计算单元之间动态调整功率分配,以优化系统的能效比。

UCIe 1.1 于2023年8月发布覆盖涵盖了芯片到芯片之间的I/O 物理层、协议和软件堆栈等规范。之后时隔1年,UCIe 2.0规范正式发布。UCIe 2.0规范引入了对可管理性标准化系统架构的支持,并全面解决了系统级封装(SiP)生命周期中跨多个芯粒的可测试性、可管理性和调试(DFx)的设计难题。

UCIE 2.0升级要点

1全面支持具有多个Chiplets的任何系统级封装 (SiP) 结构的可管理性、调试和测试。

2支持3D封装,显著提升带宽密度和功率效率。

3改进的系统级解决方案,其可管理性被定义为chiplet堆栈的一部分。

4针对互操作性和合规性测试优化的封装设计。

5完全向后兼容 UCIe 1.1 和 UCIe 1.0。

关于我们

AI网络全栈式互联架构产品及解决方案提供商

奇异摩尔,成立于2021年初,是一家行业领先的AI网络全栈式互联产品及解决方案提供商。公司依托于先进的高性能RDMA 和Chiplet技术,创新性地构建了统一互联架构——Kiwi Fabric,专为超大规模AI计算平台量身打造,以满足其对高性能互联的严苛需求。

我们的产品线丰富而全面,涵盖了面向不同层次互联需求的关键产品,如面向北向Scale out网络的AI原生智能网卡、面向南向Scale up网络的GPU片间互联芯粒、以及面向芯片内算力扩展的2.5D/3D IO Die和UCIe Die2Die IP等。这些产品共同构成了全链路互联解决方案,为AI计算提供了坚实的支撑。

奇异摩尔的核心团队汇聚了来自全球半导体行业巨头如NXPIntel、Broadcom等公司的精英,他们凭借丰富的AI互联产品研发和管理经验,致力于推动技术创新和业务发展。团队拥有超过50个高性能网络及Chiplet量产项目的经验,为公司的产品和服务提供了强有力的技术保障。我们的使命是支持一个更具创造力的芯世界,愿景是让计算变得简单。奇异摩尔以创新为驱动力,技术探索新场景,生态构建新的半导体格局,为高性能AI计算奠定稳固的基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20325

    浏览量

    254718
  • 芯片
    +关注

    关注

    463

    文章

    54384

    浏览量

    469039
  • 封装
    +关注

    关注

    128

    文章

    9320

    浏览量

    149028
  • chiplet
    +关注

    关注

    6

    文章

    499

    浏览量

    13643

原文标题:线上直播 | AIGC时代:邀您共探Chiplet互联趋势与Die-to-Die接口技术

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何用锁相放大器实现高精度LCR测量

    在现代电子测量中,LCR测量(电感、电容、电阻)的精度直接影响到电路设计与系统稳定性。传统方法易受噪声干扰与相位漂移影响,难以实现高精度检测。而结合锁相放大技术的测量方案,凭借其卓越的噪声抑制能力和相位解析能力,已成为实现高精度LCR测量的有效途径
    的头像 发表于 03-04 17:36 1133次阅读
    如何用锁相放大器实现高精度LCR测量

    龙芯OPS主板,书写智能智慧办公新篇章

    在数字化、网络化、智能化日益成熟的今天,智能智慧办公已逐渐成为企业提升竞争力、提高工作效率的必由之路。传统的办公模式已无法满足企业对效率、灵活性和安全性的需求,而智能智慧办公正是解决这些问题的有效途径
    的头像 发表于 01-20 09:29 285次阅读

    亚马逊发布新一代AI芯片Trainium3,性能提升4倍

    Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。     作为亚马逊首款3纳米工艺AI芯片,Trainium3的核心突破在于性能、能效与
    的头像 发表于 12-09 08:37 8842次阅读
    亚马逊发布新一代AI<b class='flag-5'>芯片</b>Trainium3,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>4倍

    亚马逊新一代自研服务器芯片Graviton5问世,性能提升25%

    ,基于Graviton5的全新EC2 M9g实例性能提升高达25%,其每个芯片配备192核及5倍扩容缓存,助力客户在扩展工作负载、提升应用性能
    的头像 发表于 12-09 08:33 5602次阅读

    单RF芯片XL2400T 性能提升 价格不变,输出功率最大13dBm

    为-40+125℃。XL2422T性价比非常高,射频性较于与第一代第二代产品大幅度提升,而价格保持一致。XL2400T芯片和调试模组都可以在芯岭技术官方淘宝店铺内购买。 []() XL2400T芯片
    发表于 11-21 14:32

    基于感知引导的多步骤精细操作任务与运动规划

    传统的任务与运动规划(TAMP)系统在机器人操作应用中通常依赖静态模型运行,因此在面对新环境时往往表现不佳。将感知与操作相融合,是应对这一挑战的有效途径,使机器人能够在执行过程中实时更新规划,从而适应动态变化的场景。
    的头像 发表于 11-14 10:18 1608次阅读
    基于感知引导的多步骤精细操作任务与运动规划

    Sub-GHz射频芯片,如何降低IoT终端功耗,提升传输性能

    在物联网(IoT)深度渗透千行百业的当下,Sub-GHz射频芯片作为低功耗广域网(LPWAN)的核心通信单元,正面临着“传输性能与能效平衡”的关键挑战——传输距离、数据速率与运行功耗往往存在着“制约
    的头像 发表于 09-22 15:19 718次阅读
    Sub-GHz射频<b class='flag-5'>芯片</b>,如何降低IoT终端功耗,<b class='flag-5'>提升</b>传输<b class='flag-5'>性能</b>?

    怎样有效的规避电磁干扰?

    电磁干扰的形成有三个环节:骚扰源、传播途径、敏感设备,三个环节缺一不可,同样三个环节的任何一个环节没有有效的控制都会影响到最终的测量数据。 之前有篇文章详细介绍了前端数字化是是如何实现电磁兼容
    的头像 发表于 08-18 13:17 697次阅读

    SOLIDWORKS2025在性能和响应速度方面进行了大幅提升

    在工程设计领域,软件的性能和响应速度是衡量其效率与用户体验的重要指标。SOLIDWORKS作为CAD软件之一,始终致力于为用户提供更有效、更稳定的设计平台。随着solidworks2025版本的发布,其在性能和响应速度方面实现了
    的头像 发表于 08-06 10:25 1180次阅读

    基于纳米流体强化的切割液性能提升与晶圆 TTV 均匀性控制

    摘要:本文围绕基于纳米流体强化的切割液性能提升及对晶圆 TTV 均匀性的控制展开研究。探讨纳米流体强化切割液在冷却、润滑、排屑等性能方面的提升机制,分析其对晶圆 TTV 均匀性的影响路
    的头像 发表于 07-25 10:12 650次阅读
    基于纳米流体强化的切割液<b class='flag-5'>性能</b><b class='flag-5'>提升</b>与晶圆 TTV 均匀性控制

    芯片相关知识交流分享

    生存被动局面的有效途径。光通信系统设备商,对国外的依赖程度还是比较高,其所需的核心光电子器件,仍是需要依赖进口。 注:资料来源于网络,只限分享交流相关行业知识,不代表做出任何承诺,如有不妥,麻烦联系删帖
    发表于 07-03 09:54

    从协议壁垒到无缝协同:Profibus转Profinet网关的智造赋能逻辑

    开疆智能Profibus转Profinet网关与智能送丝系统的联合应用不仅解决了传统通信协议的局限,还提升了整个制造流程的智能化水平。如果您正在寻求提升生产效率、降低成本、增强市场竞争力的有效途径,不妨考虑我们的产品。让我们一同
    的头像 发表于 06-24 17:09 363次阅读

    三相电机驱动系统逆变器故障补救与容错策略

    的薄弱环节中。因此,实施逆变器的故障诊断、故障离、故障补救与容错策略是提高电机驱动系统安全性的有效途径。电机容错驱动是指通过对系统故障进行实时诊断和分析,在发生故障后主动重构系统的软硬件结构,从而确保整个
    发表于 06-12 14:01

    引进白光干涉仪管控微流控芯片形貌,性能大幅提升

    白光干涉仪纳米级管控微流控芯片表面粗糙度,以及微流道高度和宽度,提升微流控产品性能与质量,满足不同客户需求。
    的头像 发表于 05-29 17:34 798次阅读
    引进白光干涉仪管控微流控<b class='flag-5'>芯片</b>形貌,<b class='flag-5'>性能</b>大幅<b class='flag-5'>提升</b>

    快手上线鸿蒙应用高性能解决方案:数据反序列化性能提升90%

    近日,快手在Gitee平台上线了鸿蒙应用性能优化解决方案“QuickTransformer”,该方案针对鸿蒙应用开发中广泛使用的三方库“class-transformer”进行了深度优化,有效提升
    发表于 05-15 10:01