0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安谋科技发布NPU IP“周易”X3,驱动架构革新再定义端侧AI

科技讯息 来源:科技讯息 作者:科技讯息 2025-11-17 11:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2025年11月13日,安谋科技Arm China在上海隆重发布新一代NPU IP“周易”X3。作为专为大模型时代打造的尖端产品,采用革命性的DSP+DSA混合架构,具备全面精度支持与多项自研硬件加速技术,致力于为智能汽车、移动终端、智能物联网等关键领域注入强大AI算力,提升端侧计算效率,推动边缘AI规模化部署。

一、架构革新:专为大模型而生,开启浮点计算新纪元

“周易”X3的核心突破在于其底层架构的彻底革新。它采用了专为应对复杂大模型计算挑战而设计的最新DSP+DSA架构,实现了从传统定点计算向高性能浮点计算的关键跨越。该架构支持灵活的算力配置,单计算集群Cluster可提供高达8-80 FP8 TFLOPS的算力,同时单核心Core带宽飙升至256GB/s,为数据密集型的大模型应用提供了坚实的数据吞吐保障。

尤为关键的是,“周易”X3原生支持了端侧高效运行大模型所必需的W4A8与W4A16计算加速模式。通过对模型权重进行低比特量化,有效大幅降低了内存带宽消耗,打通了云端大模型向资源受限的端侧设备高效迁移的技术路径。

wKgZPGkal2CAf1G7AAu-E4WWfv8653.png

二、性能飞跃:算力密度与效率双提升,大模型能力激增十倍

得益于架构的根本性升级,“周易”X3在性能上实现了质的飞跃。官方数据显示,相较于前代“周易”X2,新一代“周易”X3在处理广泛应用的CNN模型时,性能提升高达30%至50%。更为惊人的是,在相同算力规格下,其AIGC大模型处理能力实现了10倍级的跨越式增长。这一惊人表现,源于其16倍的FP16 TFLOPS算力提升、4倍的计算核心带宽增长,及超过10倍的Softmax和LayerNorm关键运算性能强化。实测标明,多核协同工作的算力线性度达到了优异的70%-80%,确保了算力的高效利用。

在实际大模型推理测试中,“周易”X3的表现同样耀眼。在运行Llama2 7B等主流大模型时,其预填充Prefill阶段的算力利用率高达72%,而在关键的解码Decode阶段,在安谋科技自研解压硬件WDC的加持下,有效带宽利用率更是突破了100%,远超行业平均水平,充分释放了硬件的潜在算力,为大模型在端侧的流畅运行提供了极致性能保障。

wKgZO2kal2GAQ0uKABEnMj1LAz4420.png

三、关键技术突破:四大核心引擎,精准破解端侧AI难题

“周易”X3并非简单的性能堆砌,而是通过一系列集成化的硬件创新,精准解决了端侧部署AI大模型面临的带宽、调度、精度适配等核心难题。

“周易”X3搭载自研解压硬件WDC,创新性地集成了权重解压硬件单元,支持对大模型权重进行软件无损压缩后直接硬件解压,带来约15%的等效带宽提升,有效缓解了内存墙压力。同时,集成的AI专属硬件引擎AIFF与专用硬化调度器,将CPU负载降至0.5%以下,并显著降低了任务调度延迟。这使得NPU在并行处理多路AI任务时,即使在高优先级任务需即时响应的复杂场景下,仍能保持系统流畅高效运行。

“周易”X3还支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合计算与强浮点运算能力。凭借其全面的整数与浮点计算支持,该NPU IP能够无缝适配从传统CNN模型到前沿Transformer大模型的多样化计算需求,在智能手机边缘推理、AI PC、智能汽车等不同应用中实现性能与能效的精准平衡。此外,新增的端侧大模型必备W4A8/W4A16计算加速模式,可对模型权重进行低比特量化,大幅降低带宽消耗,有效支持云端大模型向端侧的高效迁移。

wKgZPGkal2KAAC-sABKTeydlflc200.png

写在最后

安谋科技Arm China “周易”X3 NPU IP的发布,标志着端侧AI计算能力迈上了一个全新台阶。其兼具高性能、高能效与高灵活性的特点,将直接赋能智能汽车、移动终端、智能物联网、基础设施等领域。配合其成熟易用的“周易”NPU Compass AI软件平台,构成了一个完整的软硬件一体化解决方案,将极大降低开发门槛,推动创新AI应用在各行各业的快速孵化和部署。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38073

    浏览量

    296299
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20823
  • 大模型
    +关注

    关注

    2

    文章

    3439

    浏览量

    4960
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    引领大模型落地!Firefly-RK182X 开发套件上线发售

    。Rockchip全新高性能大模型协处理器RK182X,以硬核技术突破瓶颈,重构智能格局,引领
    的头像 发表于 11-26 16:33 752次阅读
    引领<b class='flag-5'>端</b><b class='flag-5'>侧</b>大模型落地!Firefly-RK182<b class='flag-5'>X</b> 开发套件上线发售

    架构/算力/软件/应用全面突破,科技Arm China用“周易X3破局端AI

    高达39.6%。然而,当大模型从云端向渗透,算力瓶颈、能效矛盾、开发门槛成为制约AI行业前进的三重枷锁。   为帮助行业破解这一难题
    的头像 发表于 11-21 08:52 7233次阅读
    <b class='flag-5'>架构</b>/算力/软件/应用全面突破,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技Arm China用“<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b>破局端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>

    发布周易X3 NPU,破局AI算力,智绘未来蓝图

    2025年11月13日,国内领先的芯片IP设计与服务提供商科技Arm China,正式揭开了新一代NPU IP
    的头像 发表于 11-17 11:47 128次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b><b class='flag-5'>发布</b>“<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b> <b class='flag-5'>NPU</b>,破局<b class='flag-5'>AI</b>算力,智绘未来蓝图

    矢量计算性能提升200%,STAR-MC3赋能AI革命

    日益增长,推动芯片设计向更高能效、更强AI算力的方向演进。   就在近期,芯片IP设计与服务提供商科技(Arm China)正式发布其自
    的头像 发表于 10-27 09:11 2241次阅读

    AI+MCU新选择,科技“星辰”STAR-MC3问世

    日前,科技Arm China发布“星辰”STAR-MC3 CPU IP解析长图,清晰展现了该产品的五大亮点、核心应用领域与“星辰”CPU
    的头像 发表于 10-23 16:01 199次阅读
    <b class='flag-5'>AI</b>+MCU新选择,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技“星辰”STAR-MC<b class='flag-5'>3</b>问世

    科技发布“星辰”STAR-MC3,提升MCU AI处理能力

    电子发烧友网综合报道 2025年9月25日,科技正式推出自主研发的第三代高能效嵌入式芯片IP——“星辰”STAR-MC3。该产品基于Arm®v8.1-M
    的头像 发表于 09-29 08:53 1w次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技<b class='flag-5'>发布</b>“星辰”STAR-MC<b class='flag-5'>3</b>,提升MCU <b class='flag-5'>AI</b>处理能力

    AI体验跃迁,天玑9500用双NPU开创AI新时代

    AI 正从“尝鲜”迈向“常用”,下一代体验该由谁定义?联发科天玑9500给出答案:行业首发将 AI 4K 文生图带到手机,引领移动影像与
    的头像 发表于 09-24 14:47 506次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    AI需求大爆发!科技发布新一代NPU IP,赋能AI终端应用

    ,汽车自动驾驶的本地决策,都依赖算力提升,这对AI SoC的性能带来挑战,上游IP厂商的新品可以给SoC厂商带来最新助力。 7月9日,在上海张江举办的
    的头像 发表于 07-11 01:16 8348次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>需求大爆发!<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技<b class='flag-5'>发布</b>新一代<b class='flag-5'>NPU</b> <b class='flag-5'>IP</b>,赋能<b class='flag-5'>AI</b>终端应用

    苹芯科技 N300 存算一体 NPU,开启 AI 新征程

    随着人工智能技术的爆发式增长,智能设备对本地算力与能效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制约
    的头像 发表于 05-06 17:01 860次阅读
    苹芯科技 N300 存算一体 <b class='flag-5'>NPU</b>,开启<b class='flag-5'>端</b><b class='flag-5'>侧</b> <b class='flag-5'>AI</b> 新征程

    首创开源架构,天玑AI开发套件让AI模型接入得心应手

    时间。 这不仅仅是工具的升级,更是迈向智能体化用户体验的关键基础设施。 天玑AI开发套件 2.0,全面释放天玑AI能力 去年,天玑AI
    发表于 04-13 19:52

    抢先试用此芯Armv9 AI PC开发套件瑞莎“星睿O6”

    DeepSeek R1的横空出世,让AI以前所未有的速度渗透到千行百业,也再次掀起了AI技术在PC、手机等设备应用的全球热潮。基于此,
    的头像 发表于 03-06 08:09 1157次阅读
    抢先试用此芯Armv9 <b class='flag-5'>AI</b> PC开发套件瑞莎“星睿O6”

    科技“周易NPU成功部署DeepSeek-R1

    应用体验。 “周易NPU处理器采用了专为大模型特性优化的架构设计,旨在提升算力,满足日益增长的AI
    的头像 发表于 02-19 10:30 986次阅读

    周易NPU处理器成功运行DeepSeek-R1模型

    近日,科技传来喜讯,其最新一代“周易NPU处理器硬件平台已成功运行DeepSeek-R1系列模型,展现出卓越的性能和成本优势,为用户提供了更高效、便捷的
    的头像 发表于 02-14 14:55 979次阅读

    软硬协同优化,科技新一代“周易NPU实现DeepSeek-R1高效部署

     近日,搭载科技最新一代“周易NPU处理器的硬件平台成功运行DeepSeek-R1系列模型,性能卓越、成本优异,为用户带来了更高效、便捷的AI
    发表于 02-14 10:52 294次阅读
    软硬协同优化,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技新一代“<b class='flag-5'>周易</b>”<b class='flag-5'>NPU</b>实现DeepSeek-R1<b class='flag-5'>端</b><b class='flag-5'>侧</b>高效部署

    炬芯科技发布ATS323X系列AI音频芯片

    刚过去不久,炬芯科技宣布全新一代基于模数混合SRAM存内计算(Mixed-mode SRAM based CIM,简称“MMSCIM”)技术的AI音频芯片正式发布,紧接着,炬芯科技
    的头像 发表于 12-12 14:58 1657次阅读