0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

简单认识高级处理器

Semi Connect 来源:Semi Connect 2023-12-07 11:31 次阅读

除了传统的处理器 (CPU、MPU/MCUDSPGPU),面向当代各种应用的高级处理器(Advanced Processors)层出不穷,例如加速处理单元 (AcceleratedProcessing Unit, APU) 、采用异构系统架构 ( Heterogeneous System Architecture,HSA) 特征设计的集成电路、基于人工神经网络(Artificial Neural Networks,ANN) 深度学习 (Deep Learning)的高级处理器等。

1. 加速处理单元

AMD 公司于2006 年收购了 ATI 公司,从设计传统的串行计算处理器 CPU过渡到并行图形处理器 GPU;经过研发升级,再将 CPU 和GPU 合为一体成为APU,集成为单个芯片,使得微处理器的性能得到改进,处理能力得以提高。APU 为随后被扩展为 HSA 走出了一条新路。AMD 公司的三代 APU 架构开发项目见表 2-15。

bbc42e08-94ab-11ee-939d-92fbcf53809c.png

2.采用异构系统架构特征设计的集成电路

HSA 最早是由 AMD 公司开发的 APU 概念扩展而来的。HSA 定义了一套计算机硬件规范,其核心为 CPU 标量处理和 GPU (或者 DSP)并行处理的结合。与此相应的有开源软件的开发与应用,包括系统级 C/C++高级语言、用于异构系统的开放计算语言 (Open Computing Language, OpenCL)结构、针对三维图形(例如 GPU)的开放图形库 (Open Graphics Library, OpenGL)、开放多进程(Open Multi-Processing, OpenMP)应用程序接口、NVIDIA 公司开发的平行计算与应用接口 ( Compute Unified Device Architecture, CUDA) 的模型、支持多种操作系统Python 等语言。2012年6月由 AMD、ARM、Imagination、联发科(MediaTek)、高通三星成立了非营利组织 HSA 协会。HSA 协会着重于开发和定义各种处理器(包括 CPU、GPU、DSP)以及存储器的特点和接口;之后,该协会又添加了 ASIC 设计公司成员,从而建立起新型的并行计算异构系统架构,如图2-31 所示。HSA 包括软件和硬件两大部分。软件包括 OpenCL、OpenMP、CUDA 模型等。图2-31中 CPU 和其专用存储器 DDR,以及 GPU 和其专用存储器 GDDR, 使用指针 (Pointer)功能传递,在HSA 系统中形成了共享的系统虚拟存储器 (System Virtual Memory, SVM)。

3.基于人工神经网络深度学习的高级处理量

约翰•麦卡锡(John McCarthy)在1956年最早使用了人工智能 (ArtificialIntelligence, AI)这个词,他也因此被称为 “人工智能之父”。AI通过使用机器学习 (Machine Learning)而设计的产品应用广泛,发展迅速。1986 年 GeffreyHinton 等人发表了神经网络中反向传播算法(Back-Propagation Algorithm)的文章。2006 年Hinton 的这一研究有了新的突破,并提出了深度学习(DeepLearning)的概念。近年来,深度神经网络 (Deep Neural Network, DNN)、卷积神经网络 ( Convolutional Neural Network, CNN)、循环神经网络 (RecurrentNeural Network,RNN,例如时间递归神经网络,即 Long Short - Term Memory,LSTM)等深度学习方法大大推动了各种芯片的设计进程。

bbe06834-94ab-11ee-939d-92fbcf53809c.png

Intel 公司 2017 年推出了 Nervana 平台,利用其 APU 产品 LakeCrest, 采用CPU 与FPGA 重组架构设计,用在深度学习的分析算法领域中。另外,Intel于2016-2017 年发布的高级CPU 都可以用在深度学习的相关领域。例如,2016年第一季度发布了 14nm 工艺制造的 Atom x5-Z8330 处理器,含有4 核4线程,L2缓存(Cache)为 2MB, 最高工作频率为 1.92GHz。 Intel 于 2016 年第四季度发布了至强(Xeon Phi)系列处理器 7290,含72核,采用14nm 工艺,集成16GB 缓存,工作频率为 1.5GHz。Intel 于 2017 年发布了第七代4核处理器 IntelCore-i7 系列,工作频率为 3.5~4.5GHz。

IBM 公司承担美国 DARPA 的 SyNAPSE 项目,基于 CNN 设计了认知计算机(Cognitive Computer),从而于 2014 年设计出备受关注的具有 4096 个 CPU 众核的真北(TrueNorth) 神经网络芯片,它有54 亿个晶体管,功耗只有70mW。它模拟2.68 亿个神经轴突(Synapse),每个 CPU 核可以模仿 256 个可编程的神经元 (Neuron),总共等效于 100 万个神经元。‍‍

中国科学院计算所2016年报道了结合 GPU 和 CPU 的深度学习专用处理器寒武纪(Cambrian)芯片,计算速度大为提高,为其虛拟现实研究建立了基础。寒武纪1号(DianNao)芯片采用 65nm 工艺.芯片面积为 3.02mm²,主频为0.98GHz,功耗为 0.485W,峰值性能达每秘 4520 亿次神经网络基本运算。寒武纪2 号(DaDianNao)芯片包含 16个处理器核,采用28nm 工艺,面积为67.7mm²,主频为 606MHz,功耗约为 16W。据称与主流 GPU 相比,寒武纪2号单芯片性能超过若干倍,能耗极低,高效能计算系统性能提升数百倍。寒武纪3号(PuDianNao)芯片采用 65nm 工艺,面积为 3.51mm²,主频为 1GHz,功耗为0.596W,峰值性能达每秒10 560 亿次基本操作。PuDianNao 运行机器学习算法时的平均性能与主流 GPGPU (通用GPU)相当,但面积和功耗仅为主流GPGPU 百分之一量级。‍‍‍

谷歌公司于2013 年9月从惠普实验室聘请了计算机体系结构领域专家 NormJouppi,参与开发被称作张量处理器 (Tensor Processing Unit, TPU)的集成电路设计,使用时通过 PCle插口去优化 CPU 和 GPU 芯片组的运行。该TPU 专为深度学习平台TensorFlow 打造,运用高层次机器深度学习与计算,可以将复杂的数据结构传输至人工智能神经网络中进行分析和处理,可以用于语音识别或图像识别等多项机器深度学习。谷歌于 2014 年合并了英国 DeepMind 公司,其具有神经智能学习功能的阿尔法围棋(AlphaGo)于2016 年5月打败了世界顶级围棋棋手李世石。AlphaGo 2.0于2017 年6月打败个人围棋大赛四冠王柯洁。阿尔法围棋是在 TPU 之上运行的,在人机比赛时最多使用了 1920 个 CPU 和 280个GPU。谷歌公司于2017 年4月5 日公开发表官方博客,介绍TPU 的架构,其处理 AI 事务速度比其他 GPU 与 CPU 结合模式快 15~30倍,计算能效高 50~80倍。这些进展为未来各种新型的高级处理器产品设计带来新的激励。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18275

    浏览量

    222157
  • dsp
    dsp
    +关注

    关注

    544

    文章

    7682

    浏览量

    344357
  • amd
    amd
    +关注

    关注

    25

    文章

    5197

    浏览量

    132632
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4417

    浏览量

    126689
  • 深度学习
    +关注

    关注

    73

    文章

    5237

    浏览量

    119908

原文标题:高级处理器,高級處理器,Advanced Processors

文章出处:【微信号:Semi Connect,微信公众号:Semi Connect】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ARM处理器简单介绍

    ARM公司开发了很多系列的ARM处理器核,目前最新的系列已经是ARM11了,而ARM6核及更早的系列已经很罕见了,ARM7以后的核也不是都获得广泛应用。目前,应用比较多的是ARM7系列、ARM9系列
    发表于 07-23 07:08

    SHARC处理器的评估系统

    SRAM模块和一个复杂的IO处理器组成,为SHARC处理器提供持续高速带宽计算。 SHARC处理器代表了当今浮点处理的事实标准,主要针对高级
    发表于 03-16 10:19

    高级处理器特性能否提高编码效率?

    高级处理器特性能否提高编码效率?
    发表于 04-26 06:41

    一个简单的微处理器设计介绍

    本实例系统是一个简单的微处理器设计(你可以按照自己的需求配置处理器)。它包含以下内容:•单个Cortex-M3或Cortex-M4处理器。•内部程序存储
    发表于 01-21 07:24

    Arm Cortex-A32处理器高级SIMD和浮点支持技术参考手册

    Arm Cortex-A32 Cortex-ACortex‑A32处理器支持A32和T32指令集中的高级SIMD和浮点指令。 Cortex‑A32浮点实现: •不生成浮点异常。 •在硬件中实现所有
    发表于 08-02 14:50

    如何用协处理器拓展指令实现更高级运算呢?

    按照这句话的意思,协处理器拓展指令只能实现读写操作吗,官方的案例貌似也只是读写指令。那如何用协处理器拓展指令实现更高级运算呢,用内联汇编吗
    发表于 08-16 07:41

    別让处理器编号混淆您的认识

    別让处理器编号混淆您的认识 随着90奈米处理器(Dothan、Prescott)与新芯片组(915/925)的问世,英特尔(Intel)也增加一项新的处理器编号命名方式
    发表于 01-25 14:34 462次阅读

    从Cortex-M到 Cortex-A认识ARM处理器

    从Cortex-M到Cortex-A认识ARM处理器
    的头像 发表于 03-08 11:34 3132次阅读

    了解高级处理器功能可促进高效编码

    了解高级处理器功能可促进高效编码
    发表于 05-14 18:38 10次下载
    了解<b class='flag-5'>高级</b><b class='flag-5'>处理器</b>功能可促进高效编码

    面向高级应用处理器的新型PMIC

    面向高级应用处理器的新型PMIC
    发表于 05-23 16:49 12次下载
    面向<b class='flag-5'>高级</b>应用<b class='flag-5'>处理器</b>的新型PMIC

    简单认识IA-64架构处理器

    IA- 64 架构处理器(IA - 64 Processors )最早为安腾架构 (Itanium Architecture)处理器的缩写,支持64 位处理技术。但由于安腾架构处理器
    的头像 发表于 11-27 09:33 591次阅读

    简单认识POWER系列架构处理器

    POWER 架构最新的处理器是 2017 年发布的 POWER9,采用14nm 工艺制造,性能远超 ×86 架构处理器。POWER 系列架构历代产品的简单说明见表 2-10。
    的头像 发表于 11-28 09:21 954次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>POWER系列架构<b class='flag-5'>处理器</b>

    简单认识MIPS架构处理器

    无互锁流水级微处理器 (Microprocessors without Interlocked Pipeline Stages,MIPS) 是流行的 RISC 架构处理器之一。其原理是尽量利用软件
    的头像 发表于 11-29 09:14 640次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>MIPS架构<b class='flag-5'>处理器</b>

    简单认识网络处理器

    网络处理器(Network Processor, NP)或者网络处理器单元 (NP Unit,NPU)可以处理各种网络通信任务,包括数据包的处理、协议分析、路由查找、声音和数据的汇聚、
    的头像 发表于 12-05 09:34 495次阅读

    简单认识安全加密处理器

    安全加密处理器 (Secure Cryptoprocessor) 是一种本身不产生加密数据或程序指令,但产生密钥(Key)的处理器,其应用产品有智能卡、ATM、电视机机顶盒、军事系统等。而加密
    的头像 发表于 12-06 09:19 542次阅读