0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3500Tokens每秒/瓦!Ceva徐明:新一代NPU IP全面赋能端侧AI基础设施

章鹰观察 来源:电子发烧友 作者:章鹰 2025-07-13 05:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

(电子发烧友原创 章鹰)2025年,在快速复苏的半导体市场里,边缘人工智能市场是一个重要的分支领域。Markets and Markets报告显示,全球边缘计算市场规模将从2023年的600亿美元增长至2029年的1106亿美元,复合年增长率达到13%。
作为边缘实现人工智能的专业厂商,Ceva拥有广泛的NPU IP组合,涵盖将人工智能嵌入MCU等微型处理器所需的IP,一直扩展到能够在笔记本电脑智能手机中实现生成式人工智能的NPU IP,和运行ADAS自动驾驶汽车的IP。

7月4日,在上海张江举办的端侧AI技术峰会上,来自Ceva中国技术支持总监徐明带来对于端侧AI市场的最新趋势分析和新品NPU IP的介绍。Ceva IP出货量达190亿,四大需求推动了端侧AI高速增长“据我们统计,全球每秒钟有60个包含Ceva IP的芯片在出货,我们历年来包含Ceva IP的芯片出货量达到190颗以上,覆盖了无人机、移动设备、AI、车载、多媒体等设备。” Ceva中国技术支持总监徐明表示。

什么驱动了边缘AI高速发展?一、实时性要求,比如ADAS和辅助驾驶要求AI部署在本地;二、隐私保护,数据私密性需求日益上升,如果数据保留在本地,将大幅度降低数据被侵犯的可能性;三、端侧推理可以减少功耗,从使用者成本考虑,一旦端侧AI平台部署完成后,使用者的成本接近为零,除了一些电费外,不需要租用云端服务器;四、更多的算法公司和软件公司推出性能优异的网络,有利于AI在端侧的部署。

国际大公司比如英伟达、谷歌、高通ARM都看好AI在端侧增长的趋势,先后推出了新芯片和新IP,在IOT和汽车端进行部署。高通正在从定制解决方案转向可扩展的人工智能边缘平台,包括对Edge Impulse的收购和Dragonwing AI soc的开发使边缘人工智能更容易被开发人员使用。英伟达边缘人工智能平台旨在直接在机器人(17.050, 0.32, 1.91%)和边缘设备上训练、模拟和部署人工智能模型,为工业、物流和自治系统的实时决策提供支持。

端侧AI兴起的三大要素,包括AI网络的支持,尺寸更加精简;硬件能力的提升来支持AI网络的部署和落地,Ceva作为IP供应商,我们和AI芯片公司合作,一起来打造这些硬件平台;将优秀的硬件和平台协同起来,加速AI设备的落地。
在云端,GPU被广泛应用,在端侧应用中,我们认为NPU将会大展拳脚,支持百亿数量级的端侧设备。Ceva中国技术支持总监徐明分享他的观点。

端侧部署面临挑战,Ceva NPU IP带来哪些助力?


“端侧设备众多,肯定具备重大挑战。它需要我们具备端到端的解决方案。NPU要有一定的剪裁性,现在的应用算力不同,未来新需求还会冒出来,架构要具备可持续发展,需要配套成熟的软件SDK,用于参考/优化AI模型的Model zoo框架,可互补解决方案的生态系统,以及面向未来的人工智能架构。” 徐明分析说。

Ceva推出了可以剪裁的NPU IP,加上成熟的SDK,来服务于整个端侧AI的应用。徐明强调,Ceva针对性地提出了相关人工智能战略,即通过可扩展的NPU+SDK助力智能边缘,在可扩展的NPU系列方面,包括支持从数据中心到边缘设备的AI推理,以及优化超低功耗和实时性能。在全栈集成方面,硬件工具主要有NeuPro NPUs+ SensPro DSP,软件工具主要包括NeuPro-Studio SDK、图形编译器。

徐明强调,Ceva的NeuPro NPU具备重要的优势和差异化特征,即可扩展性、极致能效比和高度集成性。CEVA针对transformer网络做了原生的支持和优化,特别适合生成式AI。可以实现高吞吐量的人工智能应用,且只消耗最小的功耗——针对Llama 2 和Llama3.2的一些网络可达3500Tokens每秒/瓦的性能。

其次,在NPU架构可扩展性方面,单核算力可横跨MCU到高端SoC(10 GOPS - 400 TOPS),以支持音频、视觉、故障检测、智能手机、ADAS等应用。另外,CEVA融合了DSP与NPU,具有传感器数据前处理、AI推理、后处理的统一平台。

从应用上来讲,正是Ceva具备可以剪裁的NPU IP, 我们可以支持从低算力应用到高算力应用,比如从可穿戴的低功耗设备,到目标检测、目标识别和智能安防监控等设备。大算力应用包括ADAS、智能驾驶、生成式AI应用都可以覆盖。
据悉,Ceva的NeuPro-M和NeuPro-Nano两大产品解决方案,是适用于各种工作负载的全套NPU IP,同时统一的AI SDK易于采用,可广泛应用于预测与维护、健康及健身、物体识别、监控、ADAS和Co-Pilot等应用场景。整体上,根据10GOPS-1TOPS、1-10 TOPS、10-400 TOPS三个不同算力等级划分,Ceva针对性布局了Edge AI – 32-512 MACs、1K-4K MACs和8K-128K产品,使得NeuPro NPU系列支持任何边缘人工智能部署。

本文由电子发烧友原创,转载请注明以上来源。微信号zy1052625525。需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱zhangying@huaqiu.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IP
    IP
    +关注

    关注

    5

    文章

    1849

    浏览量

    154925
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    隼瞻科技:以DSA技术为核,IP+EDA工具双驱,AI NPU算力效率跃升

    设计的需求变化,以及隼瞻科技自研EDA、IP产品如何积极助力客户成功等话题。   AI芯片设计的痛点   “隼瞻科技定位于服务半导体设计公司,提供
    的头像 发表于 12-05 13:37 4711次阅读

    正式推出新一代边缘AI芯片KL1140

    总部位于圣迭戈的 AI 科技企业 Kneron 耐今日正式发表新一代 AI 系列芯片,并由全新旗舰产品 KL1140 领衔,全面构建从终端
    的头像 发表于 11-28 15:01 342次阅读

    AI千行百业 2025 Ceva技术研讨会助力产业升级

    11月11日,2025 Ceva技术研讨会在上海长荣桂冠酒店成功举办,本次研讨会以“驱动AI,开启未来新篇”为主题,汇聚半导体产业链上下游代表,围绕人工智能(
    的头像 发表于 11-13 15:50 196次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b><b class='flag-5'>赋</b><b class='flag-5'>能</b>千行百业 2025 <b class='flag-5'>Ceva</b>技术研讨会助力产业升级

    Ceva推WiFi7 1x1客户IP 助力打造更智能、更敏捷的人工智能物联网设备及新兴物理人工智能系统

    速、更可靠且更智能的连接需求日益增长,Wi-Fi® 7成为实现边缘实时性能与新一代用户体验的关键使技术。全球领先的智能边缘领域半导体产品和软件IP授权许可厂商Ceva公司(纳斯达克股
    的头像 发表于 11-03 18:23 5324次阅读
    <b class='flag-5'>Ceva</b>推WiFi7 1x1客户<b class='flag-5'>端</b><b class='flag-5'>IP</b> 助力打造更智能、更敏捷的人工智能物联网设备及新兴物理人工智能系统

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦!

    【内测活动同步开启】这么小?这么强?新一代大模型MCP开发板来啦! 聆思全新一代六合芯片「LS26系列」,搭载WIFI / BLE & BT / NPU,与「小聆
    发表于 09-25 11:47

    AI体验跃迁,天玑9500用双NPU开创AI新时代

    AI 正从“尝鲜”迈向“常用”,下一代体验该由谁定义?联发科天玑9500给出答案:行业首发将 AI 4K 文生图带到手机,引领移动影像与
    的头像 发表于 09-24 14:47 517次阅读
    <b class='flag-5'>AI</b>体验跃迁,天玑9500用双<b class='flag-5'>NPU</b>开创<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>新时代

    此芯科技发布“合AI加速计划,边缘与AI创新

    此芯科技正式发布“合AI加速计划,旨在为边缘计算和AI场景提供高能效的全栈算力解决方案。该计划由此芯科技联合多家行业合作伙伴共同发起
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合<b class='flag-5'>一</b>”<b class='flag-5'>AI</b>加速计划,<b class='flag-5'>赋</b><b class='flag-5'>能</b>边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    AI推理效率革命,美格智能多领域落地打造行业范本

    产业进阶:AI推理助手成为应用刚需作为人工智能技术最普遍的产品形式之,“AI助手”已成为各类软件、终端的重要组成部分,成为AIAgen
    的头像 发表于 08-25 17:06 3466次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>推理<b class='flag-5'>赋</b><b class='flag-5'>能</b>效率革命,美格智能多领域落地打造行业范本

    摩尔线程“AI工厂”:以系统级创新定义新一代AI基础设施

    演讲中表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程将通过系统级工程创新,构建新一代AI训练基础设施,致力于为AGI时代打造生产先进模型的“超级工厂”。   “
    发表于 07-28 10:34 2406次阅读
    摩尔线程“<b class='flag-5'>AI</b>工厂”:以系统级创新定义<b class='flag-5'>新一代</b><b class='flag-5'>AI</b><b class='flag-5'>基础设施</b>

    AI需求大爆发!安谋科技发布新一代NPU IPAI终端应用

    ,汽车自动驾驶的本地决策,都依赖算力提升,这对AI SoC的性能带来挑战,上游IP厂商的新品可以给SoC厂商带来最新助力。 7月9日,在上海张江举办的
    的头像 发表于 07-11 01:16 8357次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>需求大爆发!安谋科技发布<b class='flag-5'>新一代</b><b class='flag-5'>NPU</b> <b class='flag-5'>IP</b>,<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>终端应用

    COMPUTEX 2025:德利以全栈存储技术AI NEXT”产业落地

    及全球化布局,展现存储技术的革新力量。AI适配性能与效的双重突破PART.01高性能存储矩阵AIPC的算力基石··PCIe5.0SSD··德
    的头像 发表于 05-21 15:05 788次阅读
    COMPUTEX 2025:德<b class='flag-5'>明</b>利以全栈存储技术<b class='flag-5'>赋</b><b class='flag-5'>能</b>“<b class='flag-5'>AI</b> NEXT”产业落地

    华邦电子创新存储智能

    华邦电子于 4 月 15 日、4 月 25 日受邀参加新唐科技 2025 新品发布会,期间进行了题为“创新存储智能”的主旨演讲,展示了华邦电子在
    的头像 发表于 05-14 09:59 1086次阅读
    华邦电子创新存储<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>端</b><b class='flag-5'>侧</b>智能<b class='flag-5'>端</b><b class='flag-5'>侧</b>

    苹芯科技 N300 存算NPU,开启 AI 新征程

    随着人工智能技术的爆发式增长,智能设备对本地算力与效的需求日益提高。而传统冯·诺依曼架构在数据处理效率上存在瓶颈,“内存墙”问题成为制约
    的头像 发表于 05-06 17:01 862次阅读
    苹芯科技 N300 存算<b class='flag-5'>一</b>体 <b class='flag-5'>NPU</b>,开启<b class='flag-5'>端</b><b class='flag-5'>侧</b> <b class='flag-5'>AI</b> 新征程

    首创开源架构,天玑AI开发套件让AI模型接入得心应手

    时间。 这不仅仅是工具的升级,更是迈向智能体化用户体验的关键基础设施。 天玑AI开发套件 2.0,全面释放天玑
    发表于 04-13 19:52

    软硬协同优化,安谋科技新一代“周易”NPU实现DeepSeek-R1高效部署

     近日,搭载安谋科技最新一代“周易”NPU处理器的硬件平台成功运行DeepSeek-R1系列模型,性能卓越、成本优异,为用户带来了更高效、便捷的AI应用体验。这款创新性NPU处理器采用
    发表于 02-14 10:52 297次阅读
    软硬协同优化,安谋科技<b class='flag-5'>新一代</b>“周易”<b class='flag-5'>NPU</b>实现DeepSeek-R1<b class='flag-5'>端</b><b class='flag-5'>侧</b>高效部署