电子发烧友网报道 近日云天励飞表示,公司用DeepEdge10为深空探测实验室的自主可控星载计算提供支撑。DeepEdge10 基于自主可控的先进国产工艺打造,搭载云天励飞第四代自研神经网络处理器 NNP400T。凭借领先的技术实力,DeepEdge10 Max承担国家科技部重大专项并通过验收。未来,云天励飞将继续努力,用自主研发AI芯片服务好国家重大工程,为建设航天强国、科技强国贡献力量。
DeepEdge10:里程碑式的国产边缘计算推理芯片系列
DeepEdge10是专为边缘大模型推理设计的SoC芯片。在国产工艺存在一定限制的背景下,它通过架构创新实现了高性能算力,解决了这一关键难题。“算力积木”架构是DeepEdge10的最大亮点。该芯片采用Chiplet(芯粒)技术,如同搭积木一般,借助D2D(Die-to-Die)和C2C(Chip-to-Chip)互联技术,能够灵活扩展算力。此外,DeepEdge10采用国产14nm工艺制造,实现了从设计到生产的完全自主可控。
在核心IP方面,DeepEdge10搭载了云天励飞自研的第四代神经网络处理器NNP400T,并集成了国产RISC-V CPU核,为芯片的强大性能提供了有力保障。算力表现上,单芯片算力根据型号不同有所差异,覆盖8Tops到50Tops甚至更高(通过扩展)。通过C2C Mesh互联架构,算力可实现无极扩展,统一内存带宽极高,能够轻松支持百亿级甚至千亿级参数的大模型在边缘端部署,满足了复杂场景下对大模型推理的需求。
DeepEdge10对热门大模型的支持方面表现出色。它已全面适配DeepSeek R1系列模型(包括1.5B、7B、32B、70B等参数规模),并完成了对DeepSeek-V3和R1 671B MoE大模型的适配工作。同时,率先完成了对DeepSeek开源的FlashMLA(高效注意力内核)的适配,大幅提升了大模型解码速度和硬件利用率。此外,DeepEdge10已完成对国产鸿蒙操作系统(HarmonyOS)的适配,还支持通义千问、Llama、SAM等主流开源模型,为用户提供了丰富的选择。
凭借灵活的算力和强大的大模型支持能力,DeepEdge10已在多个高精尖领域成功落地。在深空探测领域,它为星载计算设备提供自主可控的算力支撑,应用于天都一号/二号等卫星任务;在机器人领域,为服务机器人、移动机器人提供环境感知和决策能力;在智慧城市与安防领域,用于边缘视频分析、交通管理(如“深目”AI盒子);在智慧教育领域,应用于AI学习机、拍学机等消费级教育硬件中。
NNP400T:DeepEdge10的核心算力引擎
NNP400T(代号Nova 400)是云天励飞第四代自研神经网络处理器(NPU),作为DeepEdge10系列芯片的核心算力引擎,它专为解决大模型在边缘端的高效推理而设计。
NNP400T是云天励飞历经10年、五代NPU研发的结晶,代表了其最新的指令集架构和硬件设计思想。它采用第二代异构多核架构,能够更高效地协同处理复杂的AI计算任务和通用计算任务。“算法芯片化”是云天励飞的核心设计理念,NNP400T的硬件设计深度融合了对算法的理解,将算法的关键计算任务在硬件上进行最优化执行,从而在实际应用中发挥极致效能。
针对当前主流的大模型架构(如Transformer、BEV、LLM等),NNP400T在硬件层面进行了原生支持和优化,这是其能高效运行大模型推理的关键所在。它成功适配了FlashMLA(Multi-Head Latte Attention)等针对大模型可变长度序列优化的算子,显著提升了大模型推理时的解码速度和硬件利用率,有效解决了长序列处理中的效率瓶颈。凭借其架构优势,NNP400T能够高效支持包括DeepSeek、通义千问、Llama等在内的多种主流大模型的推理需求。
作为DeepEdge10系列的心脏,NNP400T赋予了芯片系列强大的算力。例如,在旗舰型号DeepEdge10 Max上,单芯片即可提供高达50 Tops的算力,足以支撑百亿级大模型在边缘端的实时推理。搭载NNP400T的DeepEdge10系列芯片已在多个领域实现商业化应用。
总之,DeepEdge10不仅仅是一款芯片,它是一个全栈自主的边缘AI计算平台。它通过Chiplet架构创新,证明了国产工艺芯片同样能够胜任大模型推理的重任,是目前国产边缘AI芯片中的佼佼者。而NNP400T作为其核心算力引擎,是云天励飞“算法芯片化”能力的集大成者,通过软硬件的深度协同,成功地将大模型的推理能力带到了资源受限的边缘端。
DeepEdge10:里程碑式的国产边缘计算推理芯片系列
DeepEdge10是专为边缘大模型推理设计的SoC芯片。在国产工艺存在一定限制的背景下,它通过架构创新实现了高性能算力,解决了这一关键难题。“算力积木”架构是DeepEdge10的最大亮点。该芯片采用Chiplet(芯粒)技术,如同搭积木一般,借助D2D(Die-to-Die)和C2C(Chip-to-Chip)互联技术,能够灵活扩展算力。此外,DeepEdge10采用国产14nm工艺制造,实现了从设计到生产的完全自主可控。
在核心IP方面,DeepEdge10搭载了云天励飞自研的第四代神经网络处理器NNP400T,并集成了国产RISC-V CPU核,为芯片的强大性能提供了有力保障。算力表现上,单芯片算力根据型号不同有所差异,覆盖8Tops到50Tops甚至更高(通过扩展)。通过C2C Mesh互联架构,算力可实现无极扩展,统一内存带宽极高,能够轻松支持百亿级甚至千亿级参数的大模型在边缘端部署,满足了复杂场景下对大模型推理的需求。
DeepEdge10对热门大模型的支持方面表现出色。它已全面适配DeepSeek R1系列模型(包括1.5B、7B、32B、70B等参数规模),并完成了对DeepSeek-V3和R1 671B MoE大模型的适配工作。同时,率先完成了对DeepSeek开源的FlashMLA(高效注意力内核)的适配,大幅提升了大模型解码速度和硬件利用率。此外,DeepEdge10已完成对国产鸿蒙操作系统(HarmonyOS)的适配,还支持通义千问、Llama、SAM等主流开源模型,为用户提供了丰富的选择。
凭借灵活的算力和强大的大模型支持能力,DeepEdge10已在多个高精尖领域成功落地。在深空探测领域,它为星载计算设备提供自主可控的算力支撑,应用于天都一号/二号等卫星任务;在机器人领域,为服务机器人、移动机器人提供环境感知和决策能力;在智慧城市与安防领域,用于边缘视频分析、交通管理(如“深目”AI盒子);在智慧教育领域,应用于AI学习机、拍学机等消费级教育硬件中。
NNP400T:DeepEdge10的核心算力引擎
NNP400T(代号Nova 400)是云天励飞第四代自研神经网络处理器(NPU),作为DeepEdge10系列芯片的核心算力引擎,它专为解决大模型在边缘端的高效推理而设计。
NNP400T是云天励飞历经10年、五代NPU研发的结晶,代表了其最新的指令集架构和硬件设计思想。它采用第二代异构多核架构,能够更高效地协同处理复杂的AI计算任务和通用计算任务。“算法芯片化”是云天励飞的核心设计理念,NNP400T的硬件设计深度融合了对算法的理解,将算法的关键计算任务在硬件上进行最优化执行,从而在实际应用中发挥极致效能。
针对当前主流的大模型架构(如Transformer、BEV、LLM等),NNP400T在硬件层面进行了原生支持和优化,这是其能高效运行大模型推理的关键所在。它成功适配了FlashMLA(Multi-Head Latte Attention)等针对大模型可变长度序列优化的算子,显著提升了大模型推理时的解码速度和硬件利用率,有效解决了长序列处理中的效率瓶颈。凭借其架构优势,NNP400T能够高效支持包括DeepSeek、通义千问、Llama等在内的多种主流大模型的推理需求。
作为DeepEdge10系列的心脏,NNP400T赋予了芯片系列强大的算力。例如,在旗舰型号DeepEdge10 Max上,单芯片即可提供高达50 Tops的算力,足以支撑百亿级大模型在边缘端的实时推理。搭载NNP400T的DeepEdge10系列芯片已在多个领域实现商业化应用。
总之,DeepEdge10不仅仅是一款芯片,它是一个全栈自主的边缘AI计算平台。它通过Chiplet架构创新,证明了国产工艺芯片同样能够胜任大模型推理的重任,是目前国产边缘AI芯片中的佼佼者。而NNP400T作为其核心算力引擎,是云天励飞“算法芯片化”能力的集大成者,通过软硬件的深度协同,成功地将大模型的推理能力带到了资源受限的边缘端。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
AI芯片
+关注
关注
17文章
2181浏览量
36888 -
云天励飞
+关注
关注
0文章
187浏览量
12703 -
边缘AI
+关注
关注
2文章
286浏览量
6241
发布评论请先 登录
相关推荐
热点推荐
云天励飞完成DeepSeek-V4系列模型关键机制适配验证
4月24日,DeepSeek-V4 系列模型发布。围绕该模型 CSA/HCA 混合注意力机制带来的新型计算需求,云天励飞依托自
云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目
日前,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目。根据项目规划,公司将基于自研国产
国内首个国产AI推理千卡集群落地,采用云天励飞全自研AI推理芯片
3 月 12 日,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目,中标金额4.2亿元。项目将基于云天
发表于 03-12 11:10
•1373次阅读
云天励飞中标AI龙岗一期1.22亿元项目
日前,云天励飞中标AI龙岗一期1.22亿元项目,将为龙岗区打造AI与机器人示范场景提供技术支撑,助力城市治理智能化水平持续提升。
AI教父Hinton对话云天励飞陈宁
在大模型步入深水区的当下,AI 的下一个临界点究竟在哪里?在 2025 GIS 全球创新峰会现场,深度学习奠基人、“AI 教父” Geoffrey Hinton 与云天励飞董事长兼 CEO 陈宁
云天励飞AI推理芯片如何赋能千行百业
11月26日,云天会客厅第二期生态沙龙暨深商联高科技高成长创新营走进上市公司活动圆满举办。来自深圳科技领域的多位企业负责人齐聚云天励飞,共同探讨AI推理时代的技术变革、产业机遇与落地挑
云天励飞亮相2025中国具身智能机器人大会
近日,在 2025 中国具身智能机器人大会上,云天励飞副总裁罗忆从芯片厂商的视角出发,对具身智能产业的未来进行了深入剖析,并分享了公司在 AI 推理芯片与机器人应用场景方面的整体布局。
云天励飞携手合作伙伴共探AI产业新拐点
10月17日,云天励飞携手深圳市人工智能产业协会举办“智见未来·Agent时代的产业机遇”主题沙龙,邀请来自全国50余家企业高管齐聚深圳,共同探讨AI时代的新趋势、新挑战与新机遇。
云天励飞亮相2025湾区半导体产业生态博览会
在2025湾区半导体产业生态博览会(湾芯展)上,云天励飞以“算力积木”为核心理念,携全栈AI推理产品体系重磅亮相,集中展示了从芯片到模组再到整机的完整布局,全面呈现在AI推理领域的最新
云天励飞亮相SEMI-e 2025深圳国际半导体展
9月10日,SEMI-e深圳国际半导体展暨2025集成电路产业创新展在深圳举行。云天励飞受邀出席同期举办的“端侧AI芯片新架构与新应用专题研讨会”并发表主题演讲。
云天励飞出席2025亚布力论坛创新年会
近日,2025 亚布力论坛第十一届创新年会在杭州开幕,云天励飞董事长兼 CEO 陈宁博士受邀出席,分享了他对未来 AI 产业化发展的趋势研判。
云天励飞DeepEdge10为星载计算提供支撑,搭载自研NNP400T
评论