0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用RISC-V和内存结构的开放式计算

星星科技指导员 来源:嵌入式计算设计 作者:Zvonimir Bandic 2022-06-22 15:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在过去几年中,我们目睹了数据生成、处理和进一步利用以获取额外价值和智能的方式发生了巨大变化,所有这些都受到基于深度学习神经网络应用的新计算模型出现的影响。这种深刻的变化始于数据中心,深度学习技术被用于提供对海量数据的洞察,主要用于分类和/或识别图像,启用自然语言或语音处理,或者理解、生成或成功学习如何玩复杂的游戏。策略游戏。这一变化还带来了一波更节能的计算设备(基于 GP-GPUFPGA),专门针对这类问题创建,后来包括完全定制的 ASIC

大数据和快速数据

大数据应用程序使用专业的 GP-GPU、FPGA 和 ASIC 处理器通过深度学习技术分析大型数据集,并揭示趋势、模式和关联,从而实现图像识别、语音识别等。因此,大数据主要基于过去的信息,或通常驻留在云中的剩余数据。大数据分析的一个常见结果是“训练有素”的神经网络能够执行特定任务,例如识别和标记图像或视频序列中的所有面部。语音识别也展示了神经网络的力量。

该任务最好由专门的引擎(或推理引擎)执行,这些引擎直接驻留在边缘设备上并由快速数据应用程序领导(图 1)。通过处理在边缘本地捕获的数据,Fast Data 利用源自大数据的算法来提供实时决策和结果。由于大数据提供了从“发生了什么”到“可能发生什么”(预测分析)得出的见解,Fast Data 提供了可以改进业务决策、运营和减少低效率的实时行动,这些行动总是会影响底线结果。这些方法可能适用于各种边缘和存储设备,例如相机、智能手机和 SSD

计算数据

新的工作负载基于两个场景:(1)在特定工作负载上训练大型神经网络,例如图像或语音识别;(2) 在边缘设备上应用经过训练(或“拟合”)的神经网络。这两种工作负载都需要大量并行数据处理,包括大型矩阵的乘法和卷积。这些计算函数的最佳实现需要对大型向量或数据数组进行操作的向量指令。RISC-V是一个非常适合此类应用程序的架构和生态系统,因为它提供了一个由开源软件支持的标准化流程,使开发人员能够完全自由地采用、修改甚至添加专有矢量指令。图 1 概述了突出的 RISC-V 计算架构机会。

移动数据

边缘快速数据和计算的出现产生了一个事实结果,即将所有数据来回移动到云端进行计算分析效率不高。首先,它涉及通过移动网络和以太网长距离传输相对较大的数据延迟,这对于必须实时运行的图像或语音识别应用程序来说并不是最佳选择。其次,边缘计算允许更多可扩展的架构,其中图像和语音处理或 SSD 上的内存计算操作可以以可扩展的方式执行。因此,每个添加的边缘设备都会带来所需计算能力的增量增加。数据移动方式和时间的优化是新架构可扩展性的关键因素。

【图1 | 大数据、快速数据和 RISC-V 机会]

在图 1a 中,云数据中心服务器使用深度学习神经网络对大型大数据集进行训练来执行机器学习。在图 1b 中,边缘的安全摄像头使用经过大数据训练的推理引擎,并实时识别图像(快速数据)。在图 1c 中,智能 SSD 设备使用推理引擎进行数据识别和分类,有效利用了设备的带宽。由于图 1 显示了 RISC-V 内核的潜在机会,它可以自由添加专有和未来标准化矢量指令,这些指令有助于处理深度学习和推理技术。

数据移动和访问方式的另一个类似且重要的趋势存在于大数据端和云中(图 2)。传统的计算机架构(图 2a)利用连接到许多其他设备(例如专用机器学习加速器、显卡、快速 SSD、智能网络控制器等)的慢速外围总线。慢速总线通过限制它们自身、主 CPU 和主要的、潜在的持久内存之间的通信能力来影响设备利用率。这类新的计算设备也不可能在它们之间或与主 CPU 共享内存,这会导致通过慢速总线的浪费和有限的数据移动。

关于如何改善不同计算设备(例如 CPU 和计算和网络加速器)之间的数据移动,以及如何在内存或快速存储中访问数据,出现了几个重要的行业趋势。这些新趋势专注于开放标准化工作,以提供更快、更低延迟的串行结构和更智能的逻辑协议,从而实现对共享内存的一致访问。

下一代以数据为中心的计算

未来的架构将需要为连接到计算加速器的持久内存和支持缓存一致性的快速总线(例如TileLink、RapidIO、OpenCAPI和Gen-Z)部署开放接口,不仅可以显着提高性能,还可以使所有设备能够共享内存并减少不必要的数据移动。

【图2 | 计算架构中的数据移动和访问]

在图 2a 中,由于用于快速存储和计算加速设备的外围总线速度较慢,传统计算架构已达到其极限。在图 2b 中,未来的计算架构部署开放接口,提供平台中所有计算资源对共享持久内存的统一缓存一致访问(称为以数据为中心的架构)。在图 2c 中,部署的设备能够利用相同的共享内存,从而减少不必要的数据复制。

CPU 非核心和网络接口控制器的作用将成为移动数据的关键推动力。CPU 非核心组件必须支持关键内存和持久内存接口(例如 NVDIMM-P),以及靠近 CPU 的内存。还需要实施用于计算加速器、智能网络和远程持久内存的智能和快速总线。总线上的任何设备(例如 CPU、通用或专用计算加速器、网络适配器、存储或内存)都可以包含自己的计算资源,并能够访问共享内存(图 2b 和 2c)。

为了优化数据移动,RISC-V 技术可以成为关键推动因素,因为它将在所有计算加速器设备上为新的机器学习工作负载实施矢量指令。它启用了支持开放内存和智能总线接口的开源 CPU 技术,并实现了具有连贯共享内存的新的以数据为中心的架构。

用 RISC-V 解决挑战

大数据和快速数据带来了未来的数据移动挑战,为 RISC-V 指令集架构 (ISA) 及其开放的模块化方法铺平了道路,非常适合作为以数据为中心的计算架构的基础。它提供了以下能力:

扩展边缘计算设备的计算资源

添加新指令,例如用于关键机器学习工作负载的向量指令

将小型计算核心定位在非常靠近存储和内存介质的位置

启用新的计算范式和模块化芯片设计

启用以数据为中心的新架构,其中所有处理元素都可以连贯地访问共享持久内存,优化数据移动

RISC-V由超过一百个组织的成员开发,包括一个软件和硬件创新者的协作社区,他们可以使 ISA 适应特定目的或项目。加入该组织的任何人都可以根据伯克利软件分发 (BSD) 许可设计、制造和/或销售 RISC-V 芯片和软件。

最后的想法

为了实现其价值和可能性,需要捕获、保存、访问和转换数据以充分发挥其潜力。具有大数据和快速数据应用程序的环境已经超过了通用计算架构的处理能力。未来以数据为中心的极端应用程序需要专门构建的处理,以开放的方式支持数据资源的独立扩展。

拥有一个以存储在持久内存中的数据为中心的通用开放计算机架构,同时允许所有设备发挥计算作用,是这些新的可扩展架构的关键推动因素,这些架构由一类新的机器学习计算工作负载驱动。跨所有云和边缘部分的下一代应用程序将需要这种新型的低能耗处理,因为专业计算加速处理器专注于手头的任务,减少移动数据的浪费时间,或执行与数据。人、社区和我们的星球通过数据的力量、潜力和可能性而蓬勃发展。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20381

    浏览量

    255631
  • 芯片
    +关注

    关注

    463

    文章

    54644

    浏览量

    471019
  • 机器学习
    +关注

    关注

    67

    文章

    8570

    浏览量

    137424
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    图解芯技术 | RISC-V 同构融合计算

    图解芯技术 | RISC-V 同构融合计算
    的头像 发表于 05-20 18:04 114次阅读
    图解芯技术 | <b class='flag-5'>RISC-V</b> 同构融合<b class='flag-5'>计算</b>

    深度数智推出 DC-ROMA RISC-V Mainboard III,推动开源 RISC-V 笔记本计算在 Framework Laptop 13 上进阶

    主板起售价为699美元,通过结合开放架构、现代性能以及与Framework生态的无缝集成,朝着让RISC-V成为开发者就绪、可日常使用的计算平台迈出了坚实一步。DC
    的头像 发表于 05-13 19:48 143次阅读
    深度数智推出 DC-ROMA <b class='flag-5'>RISC-V</b> Mainboard III,推动开源 <b class='flag-5'>RISC-V</b> 笔记本<b class='flag-5'>计算</b>在 Framework Laptop 13 上进阶

    RT-Thread 邀您参与“开放・连接”2026玄铁 RISC-V 生态大会,携手共铸 RISC-V“芯”纪元

    2026年3月24日,由浦东新区人民政府科经委指导,达摩院主办,上海开放处理器产业创新中心、RISC-V工作委员会、中国开放指令(RISC-V)生态联盟联合协办的本届玄铁
    的头像 发表于 03-22 10:05 709次阅读
    RT-Thread 邀您参与“<b class='flag-5'>开放</b>・连接”2026玄铁 <b class='flag-5'>RISC-V</b> 生态大会,携手共铸 <b class='flag-5'>RISC-V</b>“芯”纪元

    奕斯伟计算RISC-V创新成果亮相Embedded World 2026

    2026年3月10-12日,全球嵌入领域顶级盛会Embedded World 2026在德国纽伦堡举行。作为基于RISC-V架构的芯片产品提供商,奕斯伟计算RISC-V创新成果亮相
    的头像 发表于 03-11 16:48 523次阅读
    奕斯伟<b class='flag-5'>计算</b>携<b class='flag-5'>RISC-V</b>创新成果亮相Embedded World 2026

    Banana Pi BPI-CM6 计算模块将 8 核 RISC-V 处理器带入 CM4 外形尺寸

    RISC-V 处理器设计,而非封闭的 ARM 架构,是迈向开放式架构计算的真正一步。这为开发者提供了更大的自由度、灵活性和长期发展空间,并让他们能够访问开放的指令集。它将 GPU、A
    发表于 12-20 09:01

    重磅合作!Quintauris 联手 SiFive,加速 RISC-V 在嵌入与 AI 领域落地

    据科技区角报道半导体解决方案提供商 Quintauris 最近宣布和 RISC-V 处理器 IP 领域的头部厂商 SiFive 达成战略合作,目标直接瞄准加速 RISC-V 在嵌入、AI 系统等
    发表于 12-18 12:01

    RISC-V如何变革嵌入系统设计

    本文编译自SemiconductorDigest在开放式硬件架构、半导体技术的飞速发展,以及市场对可扩展定制计算平台需求持续增长的推动下,嵌入系统设计正经历数十年来最为重大的变革之一。在这些变革
    的头像 发表于 12-12 11:27 904次阅读
    <b class='flag-5'>RISC-V</b>如何变革嵌入<b class='flag-5'>式</b>系统设计

    为什么RISC-V是嵌入应用的最佳选择

    最近RISC-V基金会在社交媒体上发文,文章说物联网和嵌入系统正在迅速发展,需要更高的计算性能、更低的功耗和人工智能。RISC-V是为未来而建的,包括超高效的MCU到高性能应用处理器
    的头像 发表于 11-07 10:09 1960次阅读

    深度数智亮相2025年RISC-V北美峰会,携手共创开放式AI计算未来

    2025年RISC-V北美峰会堪称全球开放硬件社区发展的又一重要里程碑,RISC-V迈出国际标准化第一步——获ISO/IECJTC1授予PAS提交者资格。对深度数智而言,这次盛会正是我们展示创新成果
    的头像 发表于 10-28 17:22 908次阅读
    深度数智亮相2025年<b class='flag-5'>RISC-V</b>北美峰会,携手共创<b class='flag-5'>开放式</b>AI<b class='flag-5'>计算</b>未来

    大湾区RISC-V生态全景展示:RISC-V生态发展论坛、开发者Workshop和生态应用专区

    ),正以前所未有的速度从学术走向产业,从嵌入走向高性能计算等全场景应用。数百万计的生态开发者,还有政府和资本的加持,你将如何把握这一历史性机遇?如何深度融入蓬勃发展的RISC-V生态?   答案就在这里——由“湾芯展
    的头像 发表于 10-13 09:18 840次阅读
    大湾区<b class='flag-5'>RISC-V</b>生态全景展示:<b class='flag-5'>RISC-V</b>生态发展论坛、开发者Workshop和生态应用专区

    RISC-V 手册

    年提出。其核心理念是开放性与模块化设计,与x86(CISC)和ARM(RISC)形成差异化竞争,现已成为全球芯片创新的重要驱动力135。核心特点与优势开源开放RISC-V采用
    发表于 07-28 16:27 11次下载

    奕斯伟计算亮相2025 RISC-V中国峰会

    国际交流合作。奕斯伟计算高级副总裁、首席技术官何宁博士在主论坛发表《产业赋能:RISC-V场景化方案创新与生态协同》主题演讲,阐述了奕斯伟计算RISC-V场景化应用与生态建设上的战略
    的头像 发表于 07-22 17:34 1453次阅读

    知合计算RISC-V架构创新,阿基米德系列剑指高性能计算

    在2025 RISC-V中国峰会上,知合计算处理器设计总监刘畅就高性能RISC-V处理器架构探索与实践进行了精彩分享。 在以X86和ARM为代表的处理器架构之下,RISC-V在高性能
    的头像 发表于 07-18 14:17 3105次阅读
    知合<b class='flag-5'>计算</b>:<b class='flag-5'>RISC-V</b>架构创新,阿基米德系列剑指高性能<b class='flag-5'>计算</b>

    包云岗:原位替代 ARM,并未真正发挥 RISC-V 的优势

    RISC-V 的核心优势在于开放开源的模块化设计,相比之下,ARM 的优势在于成熟的生态闭环。因此,在第五届(2025)RISC-V 中国峰会主论坛上,中国科学院计算技术研究所副所长、
    发表于 07-17 14:54 5276次阅读

    RISC-V International CEO:RISC-V 应用全面开花,2031 年渗透率将达 25.7%

    and RISC-V Adoption in 2025》。   当前,RISC-V 的成功已从嵌入计算领域加速向存储技术与高性能计算(H
    发表于 07-17 10:28 3837次阅读
    <b class='flag-5'>RISC-V</b> International CEO:<b class='flag-5'>RISC-V</b> 应用全面开花,2031 年渗透率将达 25.7%