0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

韩国政企组团研发NPU,大模型算力需求推动中国AI神经网络处理芯片发展

Robot Vision 来源:电子发烧友网原创 作者:李宁远 2023-07-02 09:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李宁远)近日,韩国政府拟与AI芯片、云计算企业联合,组建团队研发高算力、低能耗的神经网络处理器NPU推理芯片。这一举措的目的是与英伟达竞争并避开英伟达主导的图形处理单元GPU市场。

自OpenAI旗下的智能聊天机器人程序ChatGPT去年年末发布后,全球掀起了一波人工智能热潮,热度持续至今。ChatGPT超出人们预期的智能化表现掀起了人工智能领域的技术革命。这一场生成式人工智能热潮催生了海量的数据,处理海量的数据离不开背后庞大的基础算力作为支撑。

CPU、GPU和DPU作为人们熟知的人工智能场景中重要的算力芯片,能够为高带宽、低延迟、数据密集的计算场景提供计算引擎,是未来处理超算流量和安全网络存储的核心硬件。而神经网络处理器NPU作为一种专门用于进行深度学习计算的芯片,在大算力应用场景的应用优势也正被业界广泛看好。

NPU,为深度学习计算而生

早在2011年,Google就已经提出了利用大规模神经网络进行图像识别的技术,由于深度学习计算需要大量的计算资源和算力支持,此时传统的CPU和GPU并不能完全满足这种需求,因此NPU应运而生。

设计NPU的目的就是为了进行深度学习计算,其特点是具有极高的计算效率和能耗效率,能够运行多个并行线程在短时间内完成大规模的神经网络计算任务。NPU的计算单元通常采用矩阵计算、向量计算等方式以保证快速完成计算任务。

同时为了计算单元快速处理数据,其存储通常采用高速缓存和显存的结合方式,方便更快地存取和读取数据。这种设计在降低计算延迟和提高复杂计算任务稳定性有着很明显的帮助。

NPU和TPU、BPU这些AI芯片一样,同属于ASIC专用集成电路,是为特定应用场景(如NPU的神经网络和深度学习场景)而设计的定制芯片,其开发成本高且周期长,但在性能和功耗上优于同时期的GPU和FPGA

传统的ASIC在开发完成后是不能更改的,这一点上NPU还是略有差异,NPU一般会具有一定的可编程性,可以通过更改配置适配不同的计算任务,所以其日后的应用空间也远不止局限于深度学习模型。

NPU这种专用芯片在特定的人工智能需求下提供了一种提升算力和能效比的新思路。虽然GPU已经针对AI算法加强了并行计算单元,但NPU更容易从高规律性的深度神经网络中获益,短时间内完成大规模的神经网络计算任务。

在ChatGPT拉高算力需求的背景推动下,NPU开始进入发展快车道。

大模型需求推动NPU产业发展

目前,国内人工智能芯片行业里GPU仍然是首选,根据IDC的数据,GPU占有90%以上的市场份额,而NPU、FPGA和其他ASIC等非GPU芯片占有的市场份额相对较少,整体市场份额接近10%,其中NPU的占比为6.3%。

在这条新赛道上,还没有哪一家厂商成为巨头主导市场,韩国政府与AI芯片、云计算企业联合发展高算力、低能耗的NPU也正是为了避开了英伟达主导的GPU市场,开辟一条新的增强AI芯片实力的道路。

今年4月已有韩媒BusinessKorea报道,三星半导体已成功量产采用三星14nm制程工艺第一代WarBoy NPU芯片,速度可以达到普通GPU的十倍,预计不久后投入市场,同时第二代WarBoy NPU芯片预计采用5nm工艺,明年或可推出。

国内NPU行业也是潜力十足,不同于CPU、GPU国内起步较慢,国内芯片设计公司在NPU这条赛道的起步时间不晚,已经有不少相关产品量产并推出应用。

华为海思自研的Da Vinci架构昇腾NPU已经在移动端AI计算领域中崭露头角,张量化的立体运算单元提供了业界领先的量化精度,在移动端AI计算中用于图像识别、语音识别、AR SLAM等应用大幅提升了运算速度。

紫光展锐的NPU也在旗下多颗SoC中搭载,采用新一代高能效NPU+VDSP架构,垂直优化计算能力,其中NPU算力达到8TOPS,相比上一代提升67%,支持图像超分、视频增强、语义分割、目标检测、文本识别等AI应用。

阿里的含光NPU也是用了自研的硬件架构,集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度。国科微的NPU芯片同样自主自研,目前相关产品正在落地,今年会择机发布嵌入自研NPU、带算力的相关产品。

寒武纪的NPU也是国内很早进入NPU赛道的玩家,目前NPU产品主要包括寒武纪1A、寒武纪1H、寒武纪1M等,其IP指令集已扩大范围授权集成到手机、安防、可穿戴设备等各类终端芯片中,整体性能上与国外厂商比肩。

芯原股份的Vivante NPU IP也已经应用于百款人工智能芯片中,不仅可满足多种芯片尺寸和功耗预算还可以结合芯原自有的其他处理器IP。同时芯原还将自有的GPU和NPU原生耦合,利用芯原独有的FLEXA低功耗低延迟同步接口通信技术,实现二者的高效协同计算和并行处理。

还有不少国内厂商在NPU已有建树,如中星微的VC0616 NPU、OPPO的自研NPU MariSilicon X、瑞芯微的自研NPU、爱芯元智的Neutron NPU等等。


 

未来NPU如何发展?

NPU作为一种专门针对深度神经网络计算的硬件器件,随着深度学习技术的不断发展,越来越多的算法模型加入,NPU 的多样化肯定会越来越重要。目前NPU在图像识别、自然语言处理以及传感器数据处理上所展现出的强大计算性能,已经从IoT消费电子领域开始向汽车自动驾驶领域等更广泛多样的场景延伸应用。

另一个发展趋势则是独立化,目前大多数NPU都需要与其他CPU/GPU等配合使用才能完成整个计算任务,对其他芯片的依赖度较高。未来NPU集成度进一步提高,能独立完成计算任务后其应用空间将更为广阔。

写在最后

NPU的诞生就是为了应对深度神经计算,在ChatGPT将算力需求再推上一个新台阶后,NPU芯片显著的能耗节约优势和高效的计算效率在算力需求愈发凸显的当下已经显露了不少发展机遇,在市场需求的推动下相关产业发展也开始加速。

和其他AI芯片相比,NPU依赖定制化,国内厂商在这一方面很有优势。在这个赛道上,可以预见竞争会越来越激烈,不过市场还没有被巨头垄断,国内厂商空间更大,可以争夺的生态位更多,国内厂商在这一细分AI芯片领域前景可期。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38091

    浏览量

    296606
  • NPU
    NPU
    +关注

    关注

    2

    文章

    358

    浏览量

    20837
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NMSIS神经网络库使用介绍

    NMSIS NN 软件库是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该库分为多个功能,每个功能涵盖特定类别
    发表于 10-29 06:08

    国产AI芯片真能扛住“内卷”?海思昇腾的这波操作藏了多少细节?

    最近行业都在说“AI的命门”,但国产芯片真的能接住这波需求吗? 前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下
    发表于 10-27 13:12

    在Ubuntu20.04系统中训练神经网络模型的一些经验

    本帖欲分享在Ubuntu20.04系统中训练神经网络模型的一些经验。我们采用jupyter notebook作为开发IDE,以TensorFlow2为训练框架,目标是训练一个手写数字识别的神经网络
    发表于 10-22 07:03

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、分布式群体智能 1)物联网AGI系统 优势: 组成部分: 2)分布式AI训练 7、发展重点:基于强化学习的后训练与推理 8、超越大模型神经符号计算 三、AGI
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+神经形态计算、类脑芯片

    AI芯片发展的重要方向。如果利用超导约瑟夫森结(JJ)来模拟与实时突触电路相连的神经元,神经网络运行的速度要比目前的数字或模拟技术提升几
    发表于 09-17 16:43

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的未来:提升还是智力

    体现在: 1、收益递减 大模型的基础的需要极大的,这首先源于昂贵的高性能AI芯片,然后是宝贵的电力、水等与环境相关的资源。 收益递减体现
    发表于 09-14 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    连接定义了神经网络的拓扑结构。 不同神经网络的DNN: 一、基于大模型AI芯片 1、Transformer
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片需求和挑战

    ②Transformer引擎③NVLink Switch系统④机密计算⑤HBM FPGA: 架构的主要特点:可重构逻辑和路由,可以快速实现各种不同形式的神经网络加速。 ASIC: 介绍了几种ASIC AI芯片
    发表于 09-12 16:07

    MediaTek从芯片到应用全方位支持端侧AI

    NPU 是专为神经网络设计的 AI 处理单元,可为各种 AI 任务提供更强大的
    的头像 发表于 08-16 10:01 1881次阅读

    芯原超低能耗NPU可为移动端大语言模型推理提供超40 TOPS

    芯原股份今日宣布其超低能耗且高性能的神经网络处理器(NPU)IP现已支持在移动端进行大语言模型(LLM)推理,AI
    的头像 发表于 06-11 10:47 635次阅读

    网络的“神经突触”:AI互联技术如何重构分布式训练范式

      电子发烧友网综合报道 随着AI技术迅猛发展,尤其是大型语言模型的兴起,对于需求呈现出爆
    的头像 发表于 06-08 08:11 7076次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>网络</b>的“<b class='flag-5'>神经</b>突触”:<b class='flag-5'>AI</b>互联技术如何重构分布式训练范式

    6TOPSNPU加持!RK3588如何重塑8K显示的边缘计算新边界

    与复杂运算。明远智睿推出的RK3588芯片,以6TOPSNPU为核心,为这一难题提供了突破性的解决方案。 从硬件架构来看,RK3588的NPU
    发表于 04-18 15:32

    【「芯片通识课:一本书读懂芯片技术」阅读体验】从deepseek看今天芯片发展

    的: 神经网络处理器(NPU)是一种模仿人脑神经网络的电路系统,是实现人工智能中神经网络计算的专用处理
    发表于 04-02 17:25

    DeepSeek推动AI需求:800G光模块的关键作用

    随着人工智能技术的飞速发展AI需求正以前所未有的速度增长。DeepSeek等大模型的训练与
    发表于 03-25 12:00

    国政府计划大幅提升AI

    近日,英国首相斯塔默宣布了一项雄心勃勃的计划,承诺到2030年,英国政府将采购多达10万块图形处理器(GPU),以大幅提升英国的AI水平
    的头像 发表于 01-14 14:18 691次阅读