0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安谋科技发布NPU IP“周易”X3,驱动架构革新再定义端侧AI

科技讯息 来源:科技讯息 作者:科技讯息 2025-11-17 11:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2025年11月13日,安谋科技Arm China在上海隆重发布新一代NPU IP“周易”X3。作为专为大模型时代打造的尖端产品,采用革命性的DSP+DSA混合架构,具备全面精度支持与多项自研硬件加速技术,致力于为智能汽车、移动终端、智能物联网等关键领域注入强大AI算力,提升端侧计算效率,推动边缘AI规模化部署。

一、架构革新:专为大模型而生,开启浮点计算新纪元

“周易”X3的核心突破在于其底层架构的彻底革新。它采用了专为应对复杂大模型计算挑战而设计的最新DSP+DSA架构,实现了从传统定点计算向高性能浮点计算的关键跨越。该架构支持灵活的算力配置,单计算集群Cluster可提供高达8-80 FP8 TFLOPS的算力,同时单核心Core带宽飙升至256GB/s,为数据密集型的大模型应用提供了坚实的数据吞吐保障。

尤为关键的是,“周易”X3原生支持了端侧高效运行大模型所必需的W4A8与W4A16计算加速模式。通过对模型权重进行低比特量化,有效大幅降低了内存带宽消耗,打通了云端大模型向资源受限的端侧设备高效迁移的技术路径。

wKgZPGkal2CAf1G7AAu-E4WWfv8653.png

二、性能飞跃:算力密度与效率双提升,大模型能力激增十倍

得益于架构的根本性升级,“周易”X3在性能上实现了质的飞跃。官方数据显示,相较于前代“周易”X2,新一代“周易”X3在处理广泛应用的CNN模型时,性能提升高达30%至50%。更为惊人的是,在相同算力规格下,其AIGC大模型处理能力实现了10倍级的跨越式增长。这一惊人表现,源于其16倍的FP16 TFLOPS算力提升、4倍的计算核心带宽增长,及超过10倍的Softmax和LayerNorm关键运算性能强化。实测标明,多核协同工作的算力线性度达到了优异的70%-80%,确保了算力的高效利用。

在实际大模型推理测试中,“周易”X3的表现同样耀眼。在运行Llama2 7B等主流大模型时,其预填充Prefill阶段的算力利用率高达72%,而在关键的解码Decode阶段,在安谋科技自研解压硬件WDC的加持下,有效带宽利用率更是突破了100%,远超行业平均水平,充分释放了硬件的潜在算力,为大模型在端侧的流畅运行提供了极致性能保障。

wKgZO2kal2GAQ0uKABEnMj1LAz4420.png

三、关键技术突破:四大核心引擎,精准破解端侧AI难题

“周易”X3并非简单的性能堆砌,而是通过一系列集成化的硬件创新,精准解决了端侧部署AI大模型面临的带宽、调度、精度适配等核心难题。

“周易”X3搭载自研解压硬件WDC,创新性地集成了权重解压硬件单元,支持对大模型权重进行软件无损压缩后直接硬件解压,带来约15%的等效带宽提升,有效缓解了内存墙压力。同时,集成的AI专属硬件引擎AIFF与专用硬化调度器,将CPU负载降至0.5%以下,并显著降低了任务调度延迟。这使得NPU在并行处理多路AI任务时,即使在高优先级任务需即时响应的复杂场景下,仍能保持系统流畅高效运行。

“周易”X3还支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合计算与强浮点运算能力。凭借其全面的整数与浮点计算支持,该NPU IP能够无缝适配从传统CNN模型到前沿Transformer大模型的多样化计算需求,在智能手机边缘推理、AI PC、智能汽车等不同应用中实现性能与能效的精准平衡。此外,新增的端侧大模型必备W4A8/W4A16计算加速模式,可对模型权重进行低比特量化,大幅降低带宽消耗,有效支持云端大模型向端侧的高效迁移。

wKgZPGkal2KAAC-sABKTeydlflc200.png

写在最后

安谋科技Arm China “周易”X3 NPU IP的发布,标志着端侧AI计算能力迈上了一个全新台阶。其兼具高性能、高能效与高灵活性的特点,将直接赋能智能汽车、移动终端、智能物联网、基础设施等领域。配合其成熟易用的“周易”NPU Compass AI软件平台,构成了一个完整的软硬件一体化解决方案,将极大降低开发门槛,推动创新AI应用在各行各业的快速孵化和部署。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42161

    浏览量

    303157
  • NPU
    NPU
    +关注

    关注

    2

    文章

    394

    浏览量

    21441
  • 大模型
    +关注

    关注

    2

    文章

    3877

    浏览量

    5301
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    科技:场景驱动、协同创新、全面赋能,抢抓 AI 发展机遇

    。在这场 AI 赛道的卡位战中,作为国内芯片 IP 领域的核心企业,科技(Arm Chi
    发表于 05-28 18:02 1315次阅读

    4TOPS NPU+8K编解码,RK3572核心板能否构建嵌入式AI的新格局?

    RK3572处理器以4TOPS NPU硬核算力+8K超高清编解码为核心,搭配成熟架构与完善生态,成为AI场景的全能算力解决方案,解锁嵌入
    的头像 发表于 05-22 10:45 1304次阅读
    4TOPS <b class='flag-5'>NPU</b>+8K编解码,RK3572核心板能否构建嵌入式<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>的新格局?

    科技“周易X3 NPU R2升级,最高算力翻倍+算力密度跃升

    近日,科技Tech Talk AI技术开放麦第二期,NPU高级产品经理Benjamin Ye分享了“周易
    的头像 发表于 05-18 15:02 129次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技“<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b> <b class='flag-5'>NPU</b> R2升级,最高算力翻倍+算力密度跃升

    霸推出开发者社区以助力部署AI应用

    霸开发者社区为合作伙伴提供优先体验通道,助力其在AI SoC 及 Cooper 开发软件上评估、构建并大规模部署
    的头像 发表于 01-08 14:50 496次阅读

    应对AI算力、内存、功耗“三堵墙”困境,科技Arm China “周易X3给出技术锦囊

    AI大模型正加速从云端向边缘与渗透,然而,算力、内存、功耗等却成了制约其规模化落地的“高墙”。专为AI计算而生的神经网络处理器(NPU
    的头像 发表于 12-18 13:45 613次阅读
    应对<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>算力、内存、功耗“三堵墙”困境,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技Arm China “<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b>给出技术锦囊

    科技:NPU技术创新,拉动AI算力落地引擎

    X3 NPU IP以及生态建设、NPU发展趋势等话题。   图:科技产品总监鲍敏祺  
    的头像 发表于 12-09 16:44 6232次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技:<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>NPU</b>技术创新,拉动<b class='flag-5'>AI</b>算力落地引擎

    引领大模型落地!Firefly-RK182X 开发套件上线发售

    。Rockchip全新高性能大模型协处理器RK182X,以硬核技术突破瓶颈,重构智能格局,引领
    的头像 发表于 11-26 16:33 2978次阅读
    引领<b class='flag-5'>端</b><b class='flag-5'>侧</b>大模型落地!Firefly-RK182<b class='flag-5'>X</b> 开发套件上线发售

    架构/算力/软件/应用全面突破,科技Arm China用“周易X3破局端AI

    高达39.6%。然而,当大模型从云端向渗透,算力瓶颈、能效矛盾、开发门槛成为制约AI行业前进的三重枷锁。   为帮助行业破解这一难题
    的头像 发表于 11-21 08:52 8063次阅读
    <b class='flag-5'>架构</b>/算力/软件/应用全面突破,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技Arm China用“<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b>破局端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>

    发布周易X3 NPU,破局AI算力,智绘未来蓝图

    2025年11月13日,国内领先的芯片IP设计与服务提供商科技Arm China,正式揭开了新一代NPU IP
    的头像 发表于 11-17 11:47 495次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b><b class='flag-5'>发布</b>“<b class='flag-5'>周易</b>”<b class='flag-5'>X3</b> <b class='flag-5'>NPU</b>,破局<b class='flag-5'>AI</b>算力,智绘未来蓝图

    芯原与谷歌联合推出开源Coral NPU IP

    芯原股份近日宣布与谷歌联合推出面向始终在线、超低能耗大语言模型应用的Coral NPU IP
    的头像 发表于 11-13 11:24 1328次阅读
    芯原与谷歌联合推出开源Coral <b class='flag-5'>NPU</b> <b class='flag-5'>IP</b>

    矢量计算性能提升200%,STAR-MC3赋能AI革命

    日益增长,推动芯片设计向更高能效、更强AI算力的方向演进。   就在近期,芯片IP设计与服务提供商科技(Arm China)正式发布其自
    的头像 发表于 10-27 09:11 2856次阅读

    AI+MCU新选择,科技“星辰”STAR-MC3问世

    日前,科技Arm China发布“星辰”STAR-MC3 CPU IP解析长图,清晰展现了该产品的五大亮点、核心应用领域与“星辰”CPU
    的头像 发表于 10-23 16:01 462次阅读
    <b class='flag-5'>AI</b>+MCU新选择,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技“星辰”STAR-MC<b class='flag-5'>3</b>问世

    科技发布“星辰”STAR-MC3,提升MCU AI处理能力

    电子发烧友网综合报道 2025年9月25日,科技正式推出自主研发的第三代高能效嵌入式芯片IP——“星辰”STAR-MC3。该产品基于Arm®v8.1-M
    的头像 发表于 09-29 08:53 1.1w次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技<b class='flag-5'>发布</b>“星辰”STAR-MC<b class='flag-5'>3</b>,提升MCU <b class='flag-5'>AI</b>处理能力

    AI体验跃迁,天玑9500用双NPU开创AI新时代

    AI 正从“尝鲜”迈向“常用”,下一代体验该由谁定义?联发科天玑9500给出答案:行业首发将 AI 4K 文生图带到手机,引领移动影像与
    的头像 发表于 09-24 14:47 951次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    AI需求大爆发!科技发布新一代NPU IP,赋能AI终端应用

    ,汽车自动驾驶的本地决策,都依赖算力提升,这对AI SoC的性能带来挑战,上游IP厂商的新品可以给SoC厂商带来最新助力。 7月9日,在上海张江举办的
    的头像 发表于 07-11 01:16 9250次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>需求大爆发!<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技<b class='flag-5'>发布</b>新一代<b class='flag-5'>NPU</b> <b class='flag-5'>IP</b>,赋能<b class='flag-5'>AI</b>终端应用