0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

端侧AI需求大爆发!安谋科技新一代NPU IP赋能AI终端应用

章鹰观察 来源:电子发烧友 作者:章鹰 2025-07-11 01:16 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友网报道 文/章鹰) 2025年是端侧AI爆发元年,以AI眼镜为例,Meta的Ray-Ban系列价格已降至299美元,2025年预计出货200万副,此外,混合AI在端侧实现手机拍照功能优化,汽车自动驾驶的本地决策,都依赖算力提升,这对端侧AI SoC的性能带来挑战,上游IP厂商的新品可以给SoC厂商带来最新助力。

7月9日,在上海张江举办的端侧AI技术论坛上,安谋科技(中国)有限公司高级产品经理叶斌表示,当前端侧AI正从概念走向现实,安谋科技自研“周易”NPU可驱动终端算力跃迁,助力产业把握端侧AI“芯”机遇。

端侧大模型参数提升,安谋科技DSA架构驱动芯片能效比


“当前,端侧设备部署的AI大模型10B为上限,Meta开源了LIama3大模型,包括8B、30B、70B模型。未来,数据将在云端汇集训练,云端AI模型将具备更强的通用性。终端设备上则进行轻量化模型运用,体现出更低延迟、更具个性化和隐私安全等优势。端侧设备,从旗舰平板、手机、智慧屏到PC,硬件平台的演进中,对AI SoC来讲,多核、算力提升成为当前主流发展趋势。”安谋科技叶斌分析说。

在他看来,随着技术发展,计算重心将进一步向更高效、更专业的计算架构或芯片转移,以平衡性能与成本,更好地支撑大模型及各类AI应用的发展。这种情况下,DSA架构仍然是端侧追求能效比和面效比的选择。端侧利用NPU IP等多核协同,实现算力提升,将成为技术发展的关键。

安谋新一代周易NPU IP支持高精度浮点运算,应对未来应用场景


叶斌指出,安谋科技新一代自研周易“NPU” IP,从架构设计角度对于transformer继续优化,兼容CNN超分场景和大模型场景加速,并且持续大规模软件投入,不断完善算字库,支持大语言模型轻量化部署与快速响应,快速满足AI PC、手机、智能座舱,ADAS等新兴端侧AI应用需求。

AI大模型要提升理解能力,必然要增加上下文窗口、序列长度来达到一个效果。AI处理器的架构设计上,充分考虑算力配比平衡的需求。

端侧AI能力受制于算力墙、内存墙和功耗墙。从应用和场景算力匹配的能力看,从存储的演进路线来说,LPDDR5X可以支持端侧10B以下的模型,主要应用在手机、PAD和PC端,汽车智能座舱都是在10B上下的模型,物联网设备的模型体量更小,未来存储演进到LPDDR6,预期模型的容量可以提升50%以上。

叶斌表示,大模型是算法、硬件平台双向奔赴的一个过程,随着更低位宽的算法应用,效果提升,最终令这些模型可以部署到端侧。未来2年到3年,更大的模型在端侧部署的场景。我们预测,20B、30B的AI模型部署在端侧,甚至到30B、40B的模型在端侧部署。

在当前趋势下,端侧AI应用对算力的需求将持续增加,从CNN时代的INT低精度变为需要高精度的FLOAT浮点运算。安谋科技新一代周易NPU做了性能的升级和优化,支持多数据类型,从INT4、 INT8、INT16以及FLOAT 浮点运算。考虑到能效比,硬件上面做到充分的复用。未来在端侧减少内存数据的搬运,中间做一个专用的加速优化。长下文场景,安谋科技在AI加速部分进行了增强。此外,我们对于多任务执行QOS技术进行增强,确保端侧AI多样应用的使用体验。

叶斌强调说:“我们看到AI大模型对带宽提出更高要求及AI计算中心偏移。结合端侧大模型诉求,端侧从NPU,追求能效比和面效比的选择。加上多级缓存,硬件流水的结构,使得数据本地化,节省数据搬运和功耗的开销。”

在端侧AI设备加速落地,AI SoC芯片设计热潮的推动下,半导体IP的战略价值不断显现。IP授权模式,安谋科技采取灵活的架构授权模式,无论是硬件、软件,NPU除了DSK架构外,软件生态也非常关键。安谋科技继承了ARM的基因,NPU IP有一套完整的软件工具链,GPU最新量化工具,还有动态识别的支持和开源的模型库,安谋科技加大投入不断完善算子库,凭借软硬件的创新系统,新一代周易NPU IP能更好满足新兴端侧AI应用需求,满足用户兼具功耗和性能优势的端侧算力体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20835
  • 安谋科技
    +关注

    关注

    0

    文章

    123

    浏览量

    8168
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    正式推出新一代边缘AI芯片KL1140

    总部位于圣迭戈的 AI 科技企业 Kneron 耐今日正式发表新一代 AI 系列芯片,并由全新旗舰产品 KL1140 领衔,全面构建从终端
    的头像 发表于 11-28 15:01 336次阅读

    架构/算力/软件/应用全面突破,科技Arm China用“周易”X3破局端AI

    高达39.6%。然而,当大模型从云端向渗透,算力瓶颈、效矛盾、开发门槛成为制约AI行业
    的头像 发表于 11-21 08:52 7254次阅读
    架构/算力/软件/应用全面突破,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技Arm China用“周易”X3破局端<b class='flag-5'>侧</b><b class='flag-5'>AI</b>

    发布“周易”X3 NPU,破局AI算力,智绘未来蓝图

    2025年11月13日,国内领先的芯片IP设计与服务提供商科技Arm China,正式揭开了新一代NPU
    的头像 发表于 11-17 11:47 132次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>发布“周易”X3 <b class='flag-5'>NPU</b>,破局<b class='flag-5'>AI</b>算力,智绘未来蓝图

    矢量计算性能提升200%,STAR-MC3AI革命

    日益增长,推动芯片设计向更高能效、更强AI算力的方向演进。   就在近期,芯片IP设计与服务提供商科技(Arm China)正式发布其自主研发的第三
    的头像 发表于 10-27 09:11 2254次阅读

    AI体验跃迁,天玑9500用双NPU开创AI新时代

    AI 正从“尝鲜”迈向“常用”,下一代体验该由谁定义?联发科天玑9500给出答案:行业首发将 AI 4K 文生图带到手机,引领移动影像与
    的头像 发表于 09-24 14:47 514次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    此芯科技发布“合AI加速计划,边缘与AI创新

    产品组合,覆盖从1.5B至32B参数规模的AI模型推理需求,满足工业、消费电子、智能终端等多样化场景的部署
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合<b class='flag-5'>一</b>”<b class='flag-5'>AI</b>加速计划,<b class='flag-5'>赋</b><b class='flag-5'>能</b>边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    AI推理效率革命,美格智能多领域落地打造行业范本

    产业进阶:AI推理助手成为应用刚需作为人工智能技术最普遍的产品形式之,“AI助手”已成为各类软件、
    的头像 发表于 08-25 17:06 3463次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>推理<b class='flag-5'>赋</b><b class='flag-5'>能</b>效率革命,美格智能多领域落地打造行业范本

    RK3576助力智慧防:8路高清采集与AI识别

    推出的米尔RK3576开发板,凭借强大的多媒体处理能力、丰富的接口支持和优异的效表现,为新一代防监控平台提供了高性能、低功耗的解决方案。 1. 防行业痛点与
    发表于 08-22 17:41

    科技CEO陈锋:立足全球标准与本土创新,AI计算“芯”时代

    表题为 《立足全球标准与本土创新, AI 计算 “ 芯 ” 时代》 的主旨演讲。聚焦新兴AI大模型技术趋势,陈锋系统性地阐述了
    发表于 07-11 16:36 1632次阅读
    <b class='flag-5'>安</b><b class='flag-5'>谋</b>科技CEO陈锋:立足全球标准与本土创新,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>计算“芯”时代

    苹芯科技 N300 存算NPU,开启 AI 新征程

    随着人工智能技术的爆发式增长,智能设备对本地算力与效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制
    的头像 发表于 05-06 17:01 862次阅读
    苹芯科技 N300 存算<b class='flag-5'>一</b>体 <b class='flag-5'>NPU</b>,开启<b class='flag-5'>端</b><b class='flag-5'>侧</b> <b class='flag-5'>AI</b> 新征程

    首创开源架构,天玑AI开发套件让AI模型接入得心应手

    猛增50倍,将训练时间从整天缩短至半小时。更快的LoRA训练,让AI基于用户
    发表于 04-13 19:52

    高通推动终端AI释放全新价值

    通过蒸馏技术将百亿参数模型压缩至设备可运行的创新,让AI推理成本大幅下降,为终端AI
    的头像 发表于 03-21 09:28 983次阅读
    高通推动<b class='flag-5'>终端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>释放全新价值

    科技“周易”NPU成功部署DeepSeek-R1

    近日,科技宣布其最新一代“周易”NPU处理器硬件平台已成功运行DeepSeek-R1系列模型,实现了软硬件协同优化的卓越性能与成本效益。这
    的头像 发表于 02-19 10:30 993次阅读

    软硬协同优化,科技新一代“周易”NPU实现DeepSeek-R1高效部署

     近日,搭载科技最新一代“周易”NPU处理器的硬件平台成功运行DeepSeek-R1系列模型,性能卓越、成本优异,为用户带来了更高效、便捷的AI
    发表于 02-14 10:52 297次阅读
    软硬协同优化,<b class='flag-5'>安</b><b class='flag-5'>谋</b>科技<b class='flag-5'>新一代</b>“周易”<b class='flag-5'>NPU</b>实现DeepSeek-R1<b class='flag-5'>端</b><b class='flag-5'>侧</b>高效部署

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的应用
    的头像 发表于 12-12 10:35 1289次阅读