0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里苦心研发Ali-NPU,AI芯片哪种跟具优势

mK5P_AItists 来源:未知 作者:胡薇 2018-04-23 17:57 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

4月19日,有消息称,阿里巴巴达摩院正在研发一款神经网络芯片——Ali-NPU,主要运用于图像视频分析、机器学习AI推理计算。按照设计,这款芯片性能将是目前市面上主流CPUGPU架构AI芯片的10倍,而制造成本和功耗仅为一半,其性价比超过40倍。

事实上,随着人工智能产业的发展,CPU、GPU、TPU、DPU、NPU、BPU……各种PU也开始爆发式出现。那么,究竟这些PU在性能和使用上有何异同,又有哪些优劣呢?

CPU:计算力占据部分很小 擅长逻辑控制

CPU是最为普遍,最为常见的中央处理器。主要包括运算器(ALU)和控制单元(CU),除此之外还包括若干寄存器、高速缓存器和它们之间通讯的数据、控制及状态的总线。依循冯诺依曼架构,CPU需要大量空间放置存储单元和控制逻辑,计算能力只占据很小的部分,更擅长逻辑控制。

CPU结构简化图

GPU:计算单元数量众多 但无法单独使用

GPU的诞生可以解决CPU在计算能力上的天然缺陷。采用数量众多的计算单元和超长的流水线,善于处理图像领域的运算加速。但GPU的缺陷也很明显,即无法单独工作,必须由CPU进行控制调用才能工作。

CPU、GPU微架构对比图

TPU:高性能低功耗 然则开发周期长、转换成本高

谷歌专门为 TensorFlow 深度学习框架定制的TPU,是一款专用于机器学习的芯片。TPU可以提供高吞吐量的低精度计算,用于模型的前向运算而不是模型训练,且能效更高。但它的缺陷主要是开发周期长、可配置性能有限,缺乏灵活性且转换成本高。

DPU:可实现快速开发与产品迭代

国际上,Wave Computing最早提出DPU。在国内,DPU最早是由深鉴科技提出,是基于Xilinx可重构特性的FPGA芯片,设计专用深度学习处理单元,且可以抽象出定制化的指令集和编译器,从而实现快速的开发与产品迭代。

深鉴“雨燕”DPU平台

NPU:运行效率提升 不支持大样本训练

NPU是神经网络处理器,在电路层模拟人类神经元和突触,并且用深度学习指令集直接处理大规模的神经元和突触,一条指令完成一组神经元的处理。相比于CPU和GPU的冯诺伊曼结构,NPU通过突触权重实现存储和计算一体化,从而提高运行效率。但NPU也有自身的缺陷,比如不支持对大量样本的训练。

BPU:比在CPU上用软件实现更为高效 不可再编程

BPU是由地平线主导的嵌入式处理器架构。第一代是高斯架构,第二代是伯努利架构,第三代是贝叶斯架构。BPU主要是用来支撑深度神经网络,比在CPU上用软件实现更为高效。然而,BPU一旦生产,不可再编程,且必须在CPU控制下使用。

从CPU、GPU的市场来看,已经基本被英特尔英伟达AMD三分天下。而在ASIC框架下的TPU,只有谷歌的体量和实力才有开发专用加速的动力。

推出DPU的深鉴科技有清华和斯坦福双重学术背景,公司目前的两条发展路线是:以芯片技术为主的纯技术路线,以及基于技术的产品路线。其处理器做深度学习应用端,不做训练端。目前,其深度压缩技术可以将神经网络压缩数十倍而不影响精度,还可以使用芯片存储深度学习算法模型,减少内存读取次数,降低运行功耗。

去年底,地平线在创办两年后终于发布首款芯片——“征程”与“旭日”。目前,这两款处理器都属于嵌入式人工智能视觉芯片,分别面向智能驾驶和智能摄像头。2018年CES上,英特尔和地平线还发布了基于伯努利架构的新一代征程处理器,其发展路径图为:2018年,感知;2019年,建模;2020年,决策。

而因为与英特尔的合作,地平线不禁让市场联想到英特尔早前重金收购的Mobileye。在嵌入式人工智能领域,Mobileye是业界领头羊。地平线在英特尔的定位版图是否是中国版Mobileye?但其创始人余凯的抱负是,地平线是要做中国的英特尔。

相较而言,阿里在三家中最为热衷芯片布局,上述包括寒武纪、深鉴科技均有阿里参投。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1654

    浏览量

    49392
  • NPU
    NPU
    +关注

    关注

    2

    文章

    394

    浏览量

    21447

原文标题:“芯痛”之下阿里苦心研发NPU AI芯片究竟哪款PU更厉害?

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    边缘AI算力临界点:深度解析176TOPS香橙派AI Station的产业价值

    了嵌入式开发所需的底层引脚。这种 “跨界” 属性使其在智慧交通、工业自动化、身智能等需要兼顾算法复杂度和硬件耦合度的场景中,具备了独特的竞争优势。 六、结语:边缘AI的新形态 OrangePi
    发表于 03-10 14:19

    使用NORDIC AI的好处

    ; 自定义 Neuton 模型博客] Axon NPU :集成在 nRF54LM20B 等高端 SoC 中的专用 AI 加速器,对 TensorFlow Lite 模型可实现最高约 15× 推理加速、显著
    发表于 01-31 23:16

    阿里自研AI芯片“真武”亮相 “通云哥”黄金三角浮出水面

    1月29日上午,平头哥官网悄然上线一款名为“真武810E”的高端AI芯片,此前被央视《新闻联播》曝光的阿里自研芯片PPU正式亮相。这是通义实验室、
    的头像 发表于 01-29 09:42 816次阅读
    <b class='flag-5'>阿里</b>自研<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>“真武”亮相 “通云哥”黄金三角浮出水面

    身智能交流会

    : GPU、NPU、专用 AI 计算芯片、边缘计算盒子、工控机、AI 计算模组等 场景应用与行业解决方案: 汽车 / 电子制造、医疗康养、物流仓储、教育培训、智能家居等领域的集成解决方
    发表于 01-22 09:55

    【新品发布】艾为重磅发布端侧AI高性能NPU语音芯片,打造智能语音体验新标杆

    数模龙头艾为电子全新推出高性能NPU神经网络智能语音处理芯片:AWA89601,集成音频专用NPU(神经网络处理器),通过声音模型训练与NPU硬件结合,该
    的头像 发表于 01-07 18:33 648次阅读
    【新品发布】艾为重磅发布端侧<b class='flag-5'>AI</b>高性能<b class='flag-5'>NPU</b>语音<b class='flag-5'>芯片</b>,打造智能语音体验新标杆

    瑞芯微SOC智能视觉AI处理器

    。B2版本通常在功耗、稳定性和部分外围接口支持上有所优化。NPU: 集成0.8 TOPS的NPU,支持INT8/INT16混合运算,能满足大多数边缘侧的轻量级AI推理需求(如分类、检测、识别)。多媒体
    发表于 12-19 13:44

    AI硬件全景解析:CPU、GPU、NPU、TPU的差异化之路,一文看懂!​

    、汽车)。 未来,随着AI应用的深化,硬件分工将更精细——可能出现专为机器人设计的专用AI芯片,或融合NPU与GPU优势的“边缘训练
    的头像 发表于 12-17 17:13 2601次阅读
    <b class='flag-5'>AI</b>硬件全景解析:CPU、GPU、<b class='flag-5'>NPU</b>、TPU的差异化之路,一文看懂!​

    安谋科技:端侧NPU技术创新,拉动AI算力落地引擎

    X3 NPU IP以及生态建设、NPU发展趋势等话题。   图:安谋科技产品总监鲍敏祺   周易X3 NPU IP正当时   安谋科技周易X3 NPU IP面向端侧
    的头像 发表于 12-09 16:44 6234次阅读
    安谋科技:端侧<b class='flag-5'>NPU</b>技术创新,拉动<b class='flag-5'>AI</b>算力落地引擎

    如何利用NPU与模型压缩技术优化边缘AI

    随着人工智能模型从设计阶段走向实际部署,工程师面临着双重挑战:在计算能力和内存受限的嵌入式设备上实现实时性能。神经处理单元(NPU)作为强大的硬件解决方案,擅长处理 AI 模型密集的计算需求。然而
    的头像 发表于 11-07 15:26 1503次阅读
    如何利用<b class='flag-5'>NPU</b>与模型压缩技术优化边缘<b class='flag-5'>AI</b>

    阿里自研AI芯片央视曝光,国产算力崛起新里程碑

    ,因为其中披露了阿里旗下平头哥最新研发的面向人工智能的PPU芯片。这一曝光,不仅让大众看到了阿里AI
    的头像 发表于 09-18 17:07 2851次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    、分布式群体智能 1)物联网AGI系统 优势: 组成部分: 2)分布式AI训练 7、发展重点:基于强化学习的后训练与推理 8、超越大模型:神经符号计算 三、AGI芯片的实现 1、技术需求 AI
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+身智能芯片

    身智能芯片:说白了就是能够感知、思考推理以及决策的一体式可达人类智能水平的智能体-----就电影里的一样。 一、身智能 第一人称视角:
    发表于 09-18 11:45

    AI芯片:科技探索与AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索与AGI愿景》一书如同一张详尽的“藏宝图”,为读者指明了通往下一代人工智能的硬件之路。作者没有停留在空洞的概念层面,而是直击核心,从冯·诺依曼架构的“内存墙”瓶颈切入,清晰阐述了
    发表于 09-17 09:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    、集成芯片、分子器件与分子忆阻器,以及打印类脑芯片等。 第五章至第八章分别探讨用化学或生物方法实现AIAI在科学发现中创新应用、实现神经形态计算与类脑
    发表于 09-05 15:10

    AI 芯片浪潮下,职场晋升新契机?

    运算能力,是其在深度学习训练环节发挥优势的关键,相关工作成果对证明专业能力极为重要。 若投身于 FPGA 芯片研发,鉴于 FPGA 可重构、灵活性高以及在特定运算中高效的特性,在准备职称申报材料时,要将
    发表于 08-19 08:58