0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

进迭时空第三代高性能核X200研发进展

进迭时空 2025-06-06 16:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

继X60和X100之后,进迭时空正在基于开源香山昆明湖架构研发第三代高性能处理器核X200。与进迭时空的第二代高性能核X100相比,X200的单位性能提升75%以上,达到了16 SpecInt2006/GHz,单核性能提升125%以上,达到了50 SpecInt2006/Core,主要应用于超级AI计算机、云计算、高阶自动驾驶等高性能计算场景。



X200是一款6发射、14级流水线的超标量乱序高性能RISC-V核。X200的整体特性如下:


SpecInt2006 > 16分/GHz,单核频率可达3.2GHz @ 7nm

支持RVV1.0,Vector Crypto 扩展以及进迭时空 IME 扩展

支持RVH,AIA技术,并且能够与进迭时空自研IOMMU配合实现完整的虚拟化

支持安全隔离技术,与进迭时空自研 IOPMP配合实现云计算级别的机密计算安全方案

支持服务器级别RAS,Trace特性

支持全芯片高效CHI互联,与进迭时空自研NoC总线配合最大128核心的并行互联

将支持2025年定稿的最新 Profile 规范(RVA25)


14bb077c-42b4-11f0-986f-92fbcf53809c.png



X200 架构与微架构创新


基于开源香山,快速迭代


“昆明湖”是开芯院开发的第三代高性能核,整体性能对标 Arm N2,达到 SpecInt2006 性能15分/GHz。开芯院不仅开源了昆明湖全部的设计代码,还提供了昆明湖的验证环境、Golden model、性能分析工具(如完整的Simpoint Flow)以及经过部分对齐的昆明湖Gem5模型。基于开源的昆明湖性能模型和架构设计,可以大大减少了处理器设计过程中架构探索的时间,并在开源性能模型的基础上进一步做微架构创新和性能迭代。


取指前端:昆明湖采用了分支预测和指令缓存访问解耦(下称Decouple)的架构,最大限度减少分支指令对高带宽取指需求的影响。分支主预测器采用两级FTB 加TAGE-SC结构,配合XS-Gem5的前端建模,设计了合理的参数规格;


执行后端:昆明湖实现了基于推测的指令唤醒与发射、Move指令消除、基于Checkpoint检测点的指令恢复等多项机制,有效降低后端指令执行延迟,并提升推测错误时的恢复速度;


访存单元:昆明湖探索了多种预取机制,基于第一级数据缓存实现了Stride, Stream, SMS, SPB的混合预取算法,基于私有的二级缓存L2 Cache实现了BOP与Temporal的算法,在SpecInt2006基准测试上取得了出色的效果。


因为香山核的全套开源以及出色的微架构设计,进迭时空X200选择基于开源昆明湖研发第三代高性能CPU核。在昆明湖的架构上,进迭时空根据面向的计算场景,对部分模块进行了优化,进一步平衡了部分模块的PPA指标。X200 SpecInt2006能够达到16分/GHz,相较前代X100提升75%以上。


14d184ca-42b4-11f0-986f-92fbcf53809c.png



取指前端升级


取指前端作为CPU核流水线的起点,其效率直接决定了后级流水线的运行负荷,是影响指令吞吐量的关键瓶颈。近年来,Apple M2, AMD Zen4 等处理器架构均在取指前端进行了大量的优化。


X200的取指前端,基于 Decouple 架构,进一步改进了FTB的结构,提升分支指令的存储利用率;扩展了对2-Taken Branch 场景的支持,可实现每周期至多预测2个跳转分支。


相应的,X200优化了指令Cache的组织结构,支持两个独立的取指块并行取指。通过调整指令Cache Tag和Data的访问流水级,缓解了指令Cache的访问冲突,进一步提升整体的取指带宽。



访存及互联设计优化


访存及互联往往是CPU核中最复杂的部分,访存单元的设计也极大地影响了CPU核的性能。


X200的访存单元优化了整体访存流水线,支持了Load/Store复用流水线,平衡了性能和资源的消耗。针对整个访存通路,通过指令提前唤醒和流水线优化,极致优化访存延迟,L1 Cache的Load To Use Latency控制在4个周期,2M Priave L2 Cache控制在10个周期,Cluster Level Cache控制在~30个周期;针对应用场景,进一步调优预取算法;核级别和簇级别均支持超深的Outstanding能力,面向AI等大数据量搬运场景,允许更多事务在下个层次的内存系统中并行,减少整体内存的访问延迟。


在互联的设计上,从核互联成簇以及多簇之间的互联,均使用了CHI的标准协议,最高可支持到CHI.F协议,核间根据簇中核的规模,使用 Ring/Mesh Bus进行互联,在提升可扩展性的同时,进一步提升簇内总线的频率与带宽。支持Cache Stash的功能,能够通过主动的缓存预存,降低关键数据包的获取延迟。


14e2f354-42b4-11f0-986f-92fbcf53809c.png



向量及AI单元优化


X200支持RISC-V Vector1.0及Vector Crypto指令集,VLEN支持256/512/1024可配,数据处理宽度支持4x128/4x256可配。矢量整型指令支持SEW=8/16/32/64;矢量浮点指令支持SEW=FP16/BF16/FP32/FP64。访存处理宽度上支持3x128/3x256的可配,并支持矢量访存指令的非对齐访问。


同时,X200支持符合RV规范的IME扩展的 AI 增强指令

(INT4/INT8/FP8/FP16/BF16/FP32),提供灵活易用的融合 AI 算力。此外,X200可配地通过接口扩展的方式支持AME扩展,以提供更加定制化的AI算力。


在此基础上,X200针对常见的应用场景,结合算法特点,对向量/AI处理能力和能效进行优化,并重点对向量访存和向量计算资源的均衡和协同、复杂访存pattern以及复杂元素置换操作在乱序核中的的实现等方面进行深度调优。同时,考虑到大带宽向量带来的庞大资源投入,X200基于对大量算法的模拟分析,评估并权衡不同指令对资源/功耗开销以及性能回报,做了不同层次的向量可配性,以满足不同应用场景的性能和PPA需求。



新扩展指令集支持


RISC-V是一个高速发展、充满活力的指令集,2024年,RISC-V共批准(Ratified)了23个规范,RISC-V正快速在各个场景下,拉近与x86、Arm之类成熟指令集的距离。X200面向应用领域的需求,进一步对RISC-V最新的扩展进行了支持:


支持QoS规范(CBQRI, QoSID),进一步提升高优先级数据的延迟表现,增强系统的稳定性和实时性

支持Svadu, Zacas扩展,分别降低多核间页表更新的代价,减少多核抢锁的概率,提升多核系统的效率

支持CFI扩展,使用Shadow Stack和 Landing Pad技术保护内存,降低系统被攻破的概率


X200 也将持续跟进RISC-V的最新扩展以及 Profile,将会支持今年定稿的最新Profile(预计为 RVA25)。



服务器级特性优化


X100已经实现了完整虚拟化、符合云计算场景的安全功能、符合计算机7*24小时稳定工作的RAS特性等。X200在X100的基础上,在完整实现这些功能的同时,也将做进一步增强。重点面向云服务应用场景,通过优化TLB及Walk Cache的组织形式,减少虚拟化多级地址翻译带来的性能损失;扩展Trace以及HPM(高性能计数器)功能,配合自研总线进行系统级优化,提升性能分析、问题定位的跟踪效率;支持更多RAS信息上报,配合全通路CHI总线支持,进一步提升总线的稳定性,配合进迭时空服务器管理固件,能够提升服务器系统可发现错误、可纠正错误、可管理错误能力。




借助于香山昆明湖出色的架构和微架构基础,进迭时空开展了X200的研发工作,并实现了对第二代处理器核X100的大幅性能提升。当前,X200已经完成了代码开发并进入了持续的PPA优化阶段,预计将在2025年Q4季度研发完毕,基于X200的高性能计算芯片将在2026年底面市。


更多X200的设计细节将在后续的公司微信公众号中陆续做介绍,敬请大家期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19896

    浏览量

    235239
  • 进迭时空
    +关注

    关注

    0

    文章

    31

    浏览量

    138
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    迎接泛机器人时代:时空如何以RISC-V架构数智未来

    21世纪经济报道记者赵娜杭州报道“这是我们的时代。”今年8月的一天,21世纪经济报道记者来到时空杭州总部。
    的头像 发表于 06-06 17:00 400次阅读
    迎接泛机器人时代:<b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>如何以RISC-V架构数智未来

    第三代半导体的优势和应用领域

    随着电子技术的快速发展,半导体材料的研究与应用不断演进。传统的硅(Si)半导体已无法满足现代电子设备对高效能和高频性能的需求,因此,第三代半导体材料应运而生。第三代半导体主要包括氮化镓(GaN
    的头像 发表于 05-22 15:04 771次阅读

    英飞凌发布第三代3D霍尔传感器TLE493D-x3系列

    近日,英飞凌的磁传感器门类再添新兵,第三代3D霍尔传感器TLE493D-x3系列在经历两产品的迭代之后应运而生。
    的头像 发表于 05-22 10:33 596次阅读
    英飞凌发布<b class='flag-5'>第三代</b>3D霍尔传感器TLE493D-<b class='flag-5'>x</b>3系列

    金升阳推出高性能第三代插件式单路驱动电源

    随着新能源电动汽车行业的蓬勃发展,其动力系统的关键组件:IGBT及SiC MOSFET驱动件需求量十分可观;为更好地迎合上述市场的需求,金升阳推出了高性能第三代插件式单路驱动电源QA_(T)-R3S系列(“T”为贴片式封装)。
    的头像 发表于 04-09 17:25 612次阅读
    金升阳推出<b class='flag-5'>高性能</b><b class='flag-5'>第三代</b>插件式单路驱动电源

    时空完成A+轮数亿元融资 加速RISC-V AI CPU产品迭代

    及生态建设。在成立至今年的快速发展中,时空布局了RISC-V高性能CPU、AI-CPU
    的头像 发表于 02-18 14:22 477次阅读
    <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>完成A+轮数亿元融资 加速RISC-V AI CPU产品迭代

    第三代半导体器件封装:挑战与机遇并存

    一、引言随着科技的不断发展,功率半导体器件在电力电子系统、电动汽车、智能电网、新能源并网等领域发挥着越来越重要的作用。近年来,第三代宽禁带功率半导体器件以其独特的高温、高频、高耐压等特性,逐渐
    的头像 发表于 02-15 11:15 816次阅读
    <b class='flag-5'>第三代</b>半导体器件封装:挑战与机遇并存

    EE-230:第三代SHARC系列处理器上的代码叠加

    电子发烧友网站提供《EE-230:第三代SHARC系列处理器上的代码叠加.pdf》资料免费下载
    发表于 01-08 14:43 0次下载
    EE-230:<b class='flag-5'>第三代</b>SHARC系列处理器上的代码叠加

    时空亮相RISC-V产业发展大会:新AI CPU引领大模型时代

    12月28日,以“发挥标准优势,繁荣产业发展”为主题的RISC-V产业发展大会在北京亦庄经开区通明湖会展中心举行。作为基于新一RISC-V架构的计算生态企业,时空受邀出席此次大会
    的头像 发表于 12-31 17:32 811次阅读
    <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>亮相RISC-V产业发展大会:新AI CPU引领大模型时代

    第三代半导体对防震基座需求前景?

    随着科技的发展,第三代半导体产业正处于快速扩张阶段。在全球范围内,各国都在加大对第三代半导体的投入,建设了众多新的晶圆厂和生产线。如中国,多地都有相关大型项目规划与建设,像苏州的国家第三代半导体
    的头像 发表于 12-27 16:15 596次阅读
    <b class='flag-5'>第三代</b>半导体对防震基座需求前景?

    第三代半导体产业高速发展

    当前,第三代半导体碳化硅(SiC)和氮化镓(GaN)功率器件产业高速发展。其中,新能源汽车市场的快速发展是第三代半导体技术推进的重要动力之一,新能源汽车需要高效、高密度的功率器件来实现更长的续航里程和更优的能量管理。
    的头像 发表于 12-16 14:19 844次阅读

    高通第三代骁龙8移动平台解锁沉浸式游戏体验

    实现强劲性能,从而带来持久的沉浸式游戏体验。配合全新升级的Snapdragon Elite Gaming特性,第三代骁龙8让智能手机成为高性能游戏的理想平台。
    的头像 发表于 11-08 10:54 3536次阅读

    第三代半导体的优势和应用

    随着科技的发展,半导体技术经历了多次变革,而第三代半导体材料的出现,正在深刻改变我们的日常生活和工业应用。
    的头像 发表于 10-30 11:24 2120次阅读

    第三代C2000器件上实现EEPROM的模拟操作

    电子发烧友网站提供《在第三代C2000器件上实现EEPROM的模拟操作.pdf》资料免费下载
    发表于 09-09 10:59 1次下载
    在<b class='flag-5'>第三代</b>C2000器件上实现EEPROM的模拟操作

    Banana Pi BPI-F3 时空RISC-V架构下,AI融合算力及其软件栈实践

    。目前,时空已经取得了显著的进展,成功推出了第一个版本的智算(带AI融合算力的智算CPU)以及配套的AI软件栈。
    的头像 发表于 09-07 14:01 1975次阅读
    Banana Pi BPI-F3 <b class='flag-5'>进</b><b class='flag-5'>迭</b><b class='flag-5'>时空</b>RISC-V架构下,AI融合算力及其软件栈实践

    时空引领AI CPU创新,Key Stone K1芯片订单破万

    在近日召开的第四届滴水湖中国RISC-V产业论坛上,时空公司以其卓越的研发实力和前瞻性的产品布局吸引了广泛关注。作为高性能AI CPU领
    的头像 发表于 08-22 14:55 1557次阅读