0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

端侧AI需求大爆发!安谋科技新一代NPU IP赋能AI终端应用

章鹰观察 来源:电子发烧友 作者:章鹰 2025-07-11 01:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友网报道 文/章鹰) 2025年是端侧AI爆发元年,以AI眼镜为例,Meta的Ray-Ban系列价格已降至299美元,2025年预计出货200万副,此外,混合AI在端侧实现手机拍照功能优化,汽车自动驾驶的本地决策,都依赖算力提升,这对端侧AI SoC的性能带来挑战,上游IP厂商的新品可以给SoC厂商带来最新助力。

7月9日,在上海张江举办的端侧AI技术论坛上,安谋科技(中国)有限公司高级产品经理叶斌表示,当前端侧AI正从概念走向现实,安谋科技自研“周易”NPU可驱动终端算力跃迁,助力产业把握端侧AI“芯”机遇。

端侧大模型参数提升,安谋科技DSA架构驱动芯片能效比


“当前,端侧设备部署的AI大模型10B为上限,Meta开源了LIama3大模型,包括8B、30B、70B模型。未来,数据将在云端汇集训练,云端AI模型将具备更强的通用性。终端设备上则进行轻量化模型运用,体现出更低延迟、更具个性化和隐私安全等优势。端侧设备,从旗舰平板、手机、智慧屏到PC,硬件平台的演进中,对AI SoC来讲,多核、算力提升成为当前主流发展趋势。”安谋科技叶斌分析说。

在他看来,随着技术发展,计算重心将进一步向更高效、更专业的计算架构或芯片转移,以平衡性能与成本,更好地支撑大模型及各类AI应用的发展。这种情况下,DSA架构仍然是端侧追求能效比和面效比的选择。端侧利用NPU IP等多核协同,实现算力提升,将成为技术发展的关键。

安谋新一代周易NPU IP支持高精度浮点运算,应对未来应用场景


叶斌指出,安谋科技新一代自研周易“NPU” IP,从架构设计角度对于transformer继续优化,兼容CNN超分场景和大模型场景加速,并且持续大规模软件投入,不断完善算字库,支持大语言模型轻量化部署与快速响应,快速满足AI PC、手机、智能座舱,ADAS等新兴端侧AI应用需求。

AI大模型要提升理解能力,必然要增加上下文窗口、序列长度来达到一个效果。AI处理器的架构设计上,充分考虑算力配比平衡的需求。

端侧AI能力受制于算力墙、内存墙和功耗墙。从应用和场景算力匹配的能力看,从存储的演进路线来说,LPDDR5X可以支持端侧10B以下的模型,主要应用在手机、PAD和PC端,汽车智能座舱都是在10B上下的模型,物联网设备的模型体量更小,未来存储演进到LPDDR6,预期模型的容量可以提升50%以上。

叶斌表示,大模型是算法、硬件平台双向奔赴的一个过程,随着更低位宽的算法应用,效果提升,最终令这些模型可以部署到端侧。未来2年到3年,更大的模型在端侧部署的场景。我们预测,20B、30B的AI模型部署在端侧,甚至到30B、40B的模型在端侧部署。

在当前趋势下,端侧AI应用对算力的需求将持续增加,从CNN时代的INT低精度变为需要高精度的FLOAT浮点运算。安谋科技新一代周易NPU做了性能的升级和优化,支持多数据类型,从INT4、 INT8、INT16以及FLOAT 浮点运算。考虑到能效比,硬件上面做到充分的复用。未来在端侧减少内存数据的搬运,中间做一个专用的加速优化。长下文场景,安谋科技在AI加速部分进行了增强。此外,我们对于多任务执行QOS技术进行增强,确保端侧AI多样应用的使用体验。

叶斌强调说:“我们看到AI大模型对带宽提出更高要求及AI计算中心偏移。结合端侧大模型诉求,端侧从NPU,追求能效比和面效比的选择。加上多级缓存,硬件流水的结构,使得数据本地化,节省数据搬运和功耗的开销。”

在端侧AI设备加速落地,AI SoC芯片设计热潮的推动下,半导体IP的战略价值不断显现。IP授权模式,安谋科技采取灵活的架构授权模式,无论是硬件、软件,NPU除了DSK架构外,软件生态也非常关键。安谋科技继承了ARM的基因,NPU IP有一套完整的软件工具链,GPU最新量化工具,还有动态识别的支持和开源的模型库,安谋科技加大投入不断完善算子库,凭借软硬件的创新系统,新一代周易NPU IP能更好满足新兴端侧AI应用需求,满足用户兼具功耗和性能优势的端侧算力体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NPU
    NPU
    +关注

    关注

    2

    文章

    386

    浏览量

    21345
  • 安谋科技
    +关注

    关注

    0

    文章

    129

    浏览量

    8441
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    MIPS 推出软件优先的 S8200 RISC-V NPU自主边缘物理 AI

    日,中国上海 —— 格罗方德(GlobalFoundries)旗下公司 MIPS 正式发布 MIPS S8200 处理器 IP 的详细信息,旨在新一代嵌入式平台的
    的头像 发表于 01-14 10:26 6.6w次阅读
    MIPS 推出软件优先的 S8200 RISC-V <b class='flag-5'>NPU</b>,<b class='flag-5'>赋</b><b class='flag-5'>能</b>自主边缘物理 <b class='flag-5'>AI</b>

    霸半导体加速推进下一代无人机AI创新

    凭借在航拍成像领域的深厚积淀,霸正将业务重心拓展至 AI 领域,快速增长的无人机应用场
    的头像 发表于 12-29 15:08 555次阅读

    华邦电子:2026年AI存储爆发

    2025 年半导体市场在AI需求爆发与全产业链复苏的双重推动下,呈现出强劲的增长态势。以EDA/IP先进方法学、先进工艺、算力芯片、
    的头像 发表于 12-23 10:20 4953次阅读
    华邦电子:2026年<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>存储<b class='flag-5'>爆发</b>

    应对AI算力、内存、功耗“三堵墙”困境,科技Arm China “周易”X3给出技术锦囊

    NPU IP,通过架构创新、软硬件协同优化与开放生态等,为应对AI“算力墙”、“内存墙”、“功耗墙”困境给出技术锦囊。     锦囊
    的头像 发表于 12-18 13:45 531次阅读
    应对<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>算力、内存、功耗“三堵墙”困境,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技Arm China “周易”X3给出技术锦囊

    科技:NPU技术创新,拉动AI算力落地引擎

    X3 NPU IP以及生态建设、NPU发展趋势等话题。   图:科技产品总监鲍敏祺   周易X3 N
    的头像 发表于 12-09 16:44 6114次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技:<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>NPU</b>技术创新,拉动<b class='flag-5'>AI</b>算力落地引擎

    正式推出新一代边缘AI芯片KL1140

    总部位于圣迭戈的 AI 科技企业 Kneron 耐今日正式发表新一代 AI 系列芯片,并由全新旗舰产品 KL1140 领衔,全面构建从终端
    的头像 发表于 11-28 15:01 851次阅读

    架构/算力/软件/应用全面突破,科技Arm China用“周易”X3破局端AI

    高达39.6%。然而,当大模型从云端向渗透,算力瓶颈、效矛盾、开发门槛成为制约AI行业
    的头像 发表于 11-21 08:52 7963次阅读
    架构/算力/软件/应用全面突破,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技Arm China用“周易”X3破局端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>

    发布“周易”X3 NPU,破局AI算力,智绘未来蓝图

    2025年11月13日,国内领先的芯片IP设计与服务提供商科技Arm China,正式揭开了新一代NPU
    的头像 发表于 11-17 11:47 426次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>发布“周易”X3 <b class='flag-5'>NPU</b>,破局<b class='flag-5'>AI</b>算力,智绘未来蓝图

    矢量计算性能提升200%,STAR-MC3AI革命

    日益增长,推动芯片设计向更高能效、更强AI算力的方向演进。   就在近期,芯片IP设计与服务提供商科技(Arm China)正式发布其自主研发的第三
    的头像 发表于 10-27 09:11 2765次阅读

    AI体验跃迁,天玑9500用双NPU开创AI新时代

    AI 正从“尝鲜”迈向“常用”,下一代体验该由谁定义?联发科天玑9500给出答案:行业首发将 AI 4K 文生图带到手机,引领移动影像与
    的头像 发表于 09-24 14:47 898次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    此芯科技发布“合AI加速计划,边缘与AI创新

    产品组合,覆盖从1.5B至32B参数规模的AI模型推理需求,满足工业、消费电子、智能终端等多样化场景的部署
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合<b class='flag-5'>一</b>”<b class='flag-5'>AI</b>加速计划,<b class='flag-5'>赋</b><b class='flag-5'>能</b>边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    AI推理效率革命,美格智能多领域落地打造行业范本

    产业进阶:AI推理助手成为应用刚需作为人工智能技术最普遍的产品形式之,“AI助手”已成为各类软件、
    的头像 发表于 08-25 17:06 4148次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>推理<b class='flag-5'>赋</b><b class='flag-5'>能</b>效率革命,美格智能多领域落地打造行业范本

    RK3576助力智慧防:8路高清采集与AI识别

    推出的米尔RK3576开发板,凭借强大的多媒体处理能力、丰富的接口支持和优异的效表现,为新一代防监控平台提供了高性能、低功耗的解决方案。 1. 防行业痛点与
    发表于 08-22 17:41

    科技CEO陈锋:立足全球标准与本土创新,AI计算“芯”时代

    表题为 《立足全球标准与本土创新, AI 计算 “ 芯 ” 时代》 的主旨演讲。聚焦新兴AI大模型技术趋势,陈锋系统性地阐述了
    发表于 07-11 16:36 1765次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技CEO陈锋:立足全球标准与本土创新,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>计算“芯”时代

    苹芯科技 N300 存算NPU,开启 AI 新征程

    随着人工智能技术的爆发式增长,智能设备对本地算力与效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制
    的头像 发表于 05-06 17:01 1335次阅读
    苹芯科技 N300 存算<b class='flag-5'>一</b>体 <b class='flag-5'>NPU</b>,开启<b class='flag-5'>端</b><b class='flag-5'>侧</b> <b class='flag-5'>AI</b> 新征程