0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

存储新时代:利用RISC-V和内存结构实现开放式计算

罗欣 来源:厂商供稿 作者:厂商供稿 2018-09-13 16:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Zvonimir Bandic博士,西部数据公司, 研发工程部,新一代平台技术高级总监

前言

在过去的几年里,我们目睹了数据的一系列巨大变化,包括数据如何被生成、处理以及进一步利用以获取额外的价值和智能,而这些变化都受到以深度学习神经网络应用为基础的新兴计算模式所影响。这种深刻的变化始于数据中心,其利用深度学习技术来提供对海量数据的洞察,主要用于分类或识别图像、支持自然语言处理或语音处理,或者理解、生成或成功学习如何玩复杂的策略游戏。这种变化催生了一批专门针对这些类别的问题而设计的高功效计算设备(基于GP-GPUFPGA),后来还产生了可完全定制的ASIC,进一步加速并提高了基于深度学习的系统的计算能力。

大数据和快速数据

大数据应用采用专门的GP-GPU、FPGA和ASIC处理器透过深度学习技术来分析大型数据集,并揭示趋势、模式和关联性,从而实现图像识别、语音识别等功能。因此,大数据是基于过去的信息或常驻在云端的静止数据。大数据分析的一个常用的功能是执行特定任务“训练过的”神经网络,例如识别和标记图像或视频序列中的所有面部,语音识别也展示了神经网络的强大功能。

这种任务最好由专门的引擎(或推理引擎)来执行,这种引擎直接驻留在边缘设备上并由快速数据应用程序(图1)来引导。通过在边缘设备上处理本地所捕获的数据,快速数据能够利用来自大数据的算法提供实时决策和结果。大数据提供了从“过去发生了什么”到“将来可能会发生什么”所演绎出的洞察(预测分析),而快速数据则提供了能够改善业务决策、运营并减少低效情形的实时行动,所以这一定会影响最终结果。这些方法可以适用于各种边缘和存储设备,例如照相机、智能手机和固态硬盘。

在数据上进行计算

新的工作负载基于两种场景:(1)针对特定工作负载(例如图像或语音识别)训练大型神经网络;以及(2)在边缘设备上应用经过训练的(或“适合的”)神经网络。两种工作负载都需要大规模并行的数据处理,其中包括大矩阵的乘法和卷积。这些计算功能的最佳实施方式需要在大矢量或数据阵列上运行的矢量指令。RISC-V就是一种非常适合于此类型应用的架构和生态系统,因为它提供了一套由开源软件支持的标准化过程,使得开发人员能够完全自由地采用、修改甚至添加专有矢量指令。图1中概述了一些显而易见的RISC-V计算架构机会。

移动数据

快速数据和边缘计算的出现产生了一个实际的后果,即:与云端之间来回移动所有数据进行计算分析并不是一件有效率的事。首先,在移动网络和以太网中进行远距离传输时,它涉及到相对较大的数据延迟传输,这对于必须实时操作的图像识别或语音识别应用而言并不是理想的。其次,在边缘设备上进行计算需要更易于伸缩的架构,其中,图像和语音处理或者在SSD上进行的内存计算操作都可用一种伸缩的方式来进行。采用这种方式,每一台新增的边缘设备都会带来所需要的增量计算能力,对数据移动方式和时间进行优化是这种架构可伸缩性的一项关键因素。

图1:大数据、快速数据和RISC-V机会

1a中,云数据中心服务器利用在大型大数据集上训练的深度学习神经网络来执行机器学习的功能。在1b中,边缘设备中的安全摄像机采用经过大数据训练的推理引擎来实时识别图像(快速数据)。在1c中,智能固态硬盘设备采用推理引擎进行数据识别和分类,从而有效地利用了此设备的带宽。图1展示了RISC-V内核的潜在机会,它可以自由地添加专有的及未来标准化的矢量指令,这些指令对于处理深度学习和推理技术相当有效。

另一个类似且重要的趋势是大数据端和云端上数据的移动及访问方式(图2)。传统的计算机体系结构(图2a)采用慢速外围总线,该总线连接到许多其他设备(例如,专用机器学习加速器、图形卡、高速固态硬盘、智能网络控制器,等等)。低速总线会影响设备的利用率,因为它限制了总线本身、主CPU以及主要的潜在持久内存之间的通信能力。这些新型计算设备也不可能在它们之间或与主CPU共享内存,从而导致在慢速总线上进行徒劳且受限制的数据移动。

关于如何改善不同计算设备(例如CPU和计算机及网络加速器)之间的数据移动,以及如何在内存或快速存储中访问数据,出现了几个重要的行业趋势。这些新趋势集中在开放标准化工作上,能够提供更快、更低延迟的串行结构以及更智能的逻辑协议,从而实现对共享内存的一致访问。

新一代以数据为中心的计算

未来的架构将需要部署开放接口,以连接到持久性内存以及接入计算加速器并支持高速缓存一致性的快速总线(例如TileLink、RapidIO®、OpenCAPI™和Gen-Z),以期大幅度提高性能,而且使所有设备共享内存并减少不必要的数据移动。

图2:计算体系结构中的数据移动和访问

图2a中,传统的计算体系结构由于把一条慢速外设总线用于快速存储器及计算加速设备,其能力已达到其极限。在图2b中,未来的计算体系结构采用了开放接口,能够为平台上所有的计算资源提供统一并支持高速缓存一致性的访问方式来访问共享持久内存,(这称为以数据为中心的体系结构)。在图2c中,所部署的设备能够使用相同的共享内存,从而减少了不必要的数据复制。

CPU 外围核心及网络接口控制器的作用将成为支持数据移动的关键因素。CPU外围核心组件必须支持密钥内存和永久内存接口(例如NVDIMM-P),也必须支持驻留在CPU附近的内存。还需要实施面向计算加速器、智能网络和远程持久内存的智能快速总线。这种总线上的任何设备(例如CPU、通用或专用计算加速器、网络适配器、存储器或内存)都可以包含其自己的计算资源并具有访问共享内存的能力(图2b和图2c)。

RISC-V技术正是优化数据移动的关键推动因素,因为它能够在所有的计算加速器设备上针对新的机器学习工作负载来执行矢量指令。它实现了多种开源CPU技术,能够支持开放内存和智能总线接口;且实现了以数据为中心具有一致性共享内存的体系结构。

利用RISC-V解决挑战

大数据和快速数据为未来的数据移动带来了挑战,也为RISC-V指令集架构(ISA)铺平了道路。这种架构开放的、模块化的方法非常适合用作以数据为中心的计算体系结构的基础。它提供了以下功能:

· 扩展边缘计算设备的计算资源

· 添加新的指令,例如用于机器学习工作负载的矢量指令

· 寻找非常接近于存储器和内存介质的小型计算内核

· 支持新型计算范式以及模块化芯片设计方法

· 支持新型以数据为中心的体系结构,其中所有的处理单元都可以透过一致的方式访问共享的持久内存,从而优化数据移动

RISC-V由超过100个组织机构的众多成员共同开发,这其中包含一个由软件和硬件创新者组成的协作性社区。这些创新者能够对ISA进行改编,使其适应特定的目的或项目。任何加入该组织的人都可以根据一份“Berkeley Software Distribution”(BSD软件发布)许可证来设计、制造和/或销售RISC-V芯片和软件。

结语

为了实现其价值和可能性,数据需要捕获、保存、访问并转换,以发挥其全部潜力。含有大数据和快速数据应用的环境已经使通用计算体系结构的处理能力相形见绌。未来以数据为中心的极端应用将需要针对特定用途设计的处理能力,以便以开放的方式支持数据资源的独立扩展。

拥有一套以在持久内存中存储的数据为中心的通用开放计算机体系结构,同时又能够让所有的设备发挥一定的计算作用,这是由新类型机器学习计算工作负载所推动的这些新型可扩展体系结构得以出现的关键因素。跨越云端及边缘设备各个部分的下一代应用都需要这种新型的低能耗处理方式,因为专门的计算加速处理器将能够专注于处理其手边的任务,从而能够减少来回移动数据所浪费的时间,或者能够执行与数据无关的额外计算。通过发挥数据的力量、潜力和可能性,人类、社会以及我们的星球都能够蓬勃发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开放式
    +关注

    关注

    0

    文章

    25

    浏览量

    9518
  • RISC-V
    +关注

    关注

    49

    文章

    2947

    浏览量

    53544
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RT-Thread 邀您参与“开放・连接”2026玄铁 RISC-V 生态大会,携手共铸 RISC-V“芯”纪元

    2026年3月24日,由浦东新区人民政府科经委指导,达摩院主办,上海开放处理器产业创新中心、RISC-V工作委员会、中国开放指令(RISC-V)生态联盟联合协办的本届玄铁
    的头像 发表于 03-22 10:05 592次阅读
    RT-Thread 邀您参与“<b class='flag-5'>开放</b>・连接”2026玄铁 <b class='flag-5'>RISC-V</b> 生态大会,携手共铸 <b class='flag-5'>RISC-V</b>“芯”纪元

    奕斯伟计算RISC-V创新成果亮相Embedded World 2026

    2026年3月10-12日,全球嵌入领域顶级盛会Embedded World 2026在德国纽伦堡举行。作为基于RISC-V架构的芯片产品提供商,奕斯伟计算RISC-V创新成果亮相
    的头像 发表于 03-11 16:48 389次阅读
    奕斯伟<b class='flag-5'>计算</b>携<b class='flag-5'>RISC-V</b>创新成果亮相Embedded World 2026

    RISC-V,正式崛起

    寡头垄断格局的终结,开启了芯片设计不再是专有技术垄断,而是全球共享资源的新时代RISC-V最初只是加州大学伯克利分校的一个小众学术项目,如今已发展成为计算领域强
    的头像 发表于 01-16 15:17 870次阅读
    <b class='flag-5'>RISC-V</b>,正式崛起

    Banana Pi BPI-CM6 计算模块将 8 核 RISC-V 处理器带入 CM4 外形尺寸

    RISC-V 处理器设计,而非封闭的 ARM 架构,是迈向开放式架构计算的真正一步。这为开发者提供了更大的自由度、灵活性和长期发展空间,并让他们能够访问开放的指令集。它将 GPU、A
    发表于 12-20 09:01

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入与 AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 在嵌入、AI 系统等
    发表于 12-18 12:01

    RISC-V如何变革嵌入系统设计

    本文编译自SemiconductorDigest在开放式硬件架构、半导体技术的飞速发展,以及市场对可扩展定制计算平台需求持续增长的推动下,嵌入系统设计正经历数十年来最为重大的变革之一。在这些变革
    的头像 发表于 12-12 11:27 793次阅读
    <b class='flag-5'>RISC-V</b>如何变革嵌入<b class='flag-5'>式</b>系统设计

    为什么RISC-V是嵌入应用的最佳选择

    最近RISC-V基金会在社交媒体上发文,文章说物联网和嵌入系统正在迅速发展,需要更高的计算性能、更低的功耗和人工智能。RISC-V是为未来而建的,包括超高效的MCU到高性能应用处理器
    的头像 发表于 11-07 10:09 1834次阅读

    深度数智亮相2025年RISC-V北美峰会,携手共创开放式AI计算未来

    2025年RISC-V北美峰会堪称全球开放硬件社区发展的又一重要里程碑,RISC-V迈出国际标准化第一步——获ISO/IECJTC1授予PAS提交者资格。对深度数智而言,这次盛会正是我们展示创新成果
    的头像 发表于 10-28 17:22 823次阅读
    深度数智亮相2025年<b class='flag-5'>RISC-V</b>北美峰会,携手共创<b class='flag-5'>开放式</b>AI<b class='flag-5'>计算</b>未来

    提高RISC-V在Drystone测试中得分的方法

    性能:内存的读写速度、延迟和带宽等都会影响到 Drystone 的性能。 指令集优化:对RISC-V指令集的优化也会影响性能。例如,对于特定的应用或计算任务,可以通过定制指令集来提高性能。 编译器优化
    发表于 10-21 13:58

    RISC-V B扩展介绍及实现

    某个方向移位并将结果存储在目标寄存器中;后者则用于为一个值生成一个位掩码。 此外,B扩展还增加了一组压缩指令,可以使指令占用更少的内存空间,从而提高系统性能。这些压缩指令兼容于RISC-V ISR
    发表于 10-21 13:01

    利用事务级加速实现高速、高质量的RISC-V验证

    引言RISC-V架构以其开放性和高度可定制的特性,正在重塑处理器设计格局。然而,这种灵活性也带来了显著的验证挑战,使其验证复杂度远超传统固定架构处理器。RISC-V的验证难点主要体现在四个方面:首先
    的头像 发表于 09-18 10:08 2252次阅读
    <b class='flag-5'>利用</b>事务级加速<b class='flag-5'>实现</b>高速、高质量的<b class='flag-5'>RISC-V</b>验证

    10万奖金池,等你挑战!CIE全国RISC-V创新应用大赛火热报名中

    为推动RISC-V技术的创新和应用,中国电子学会联合国内优势单位,聚焦基于第五代精简指令集计算原理建立的开放指令集架构(RISC-V),在全国范围组织发起了以“启芯征程,创芯
    的头像 发表于 09-16 08:07 982次阅读
    10万奖金池,等你挑战!CIE全国<b class='flag-5'>RISC-V</b>创新应用大赛火热报名中

    RISC-V 手册

    年提出。其核心理念是开放性与模块化设计,与x86(CISC)和ARM(RISC)形成差异化竞争,现已成为全球芯片创新的重要驱动力135。核心特点与优势开源开放RISC-V采用
    发表于 07-28 16:27 11次下载

    包云岗:原位替代 ARM,并未真正发挥 RISC-V 的优势

    生态(RISC-V)联盟秘书长、北京开源芯片研究院首席科学家包云岗教授表示,若仅用于原位替代 ARM,并未真正发挥 RISC-V 开放性与可定制化的优势。   RISC-V
    发表于 07-17 14:54 5246次阅读

    RISC-V International CEO:RISC-V 应用全面开花,2031 年渗透率将达 25.7%

    and RISC-V Adoption in 2025》。   当前,RISC-V 的成功已从嵌入计算领域加速向存储技术与高性能
    发表于 07-17 10:28 3800次阅读
    <b class='flag-5'>RISC-V</b> International CEO:<b class='flag-5'>RISC-V</b> 应用全面开花,2031 年渗透率将达 25.7%