0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

实现异构多核十倍嵌入式内存性能的三种方法

星星科技指导员 来源:嵌入式计算设计 作者:Brandon Lewis 2022-10-24 15:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从理论上讲,异构多核设备可以配备针对给定用例可以抛出的任何类型的操作而优化的计算块。用于视频处理的 GPU、用于对象识别的神经网络处理器、运行操作系统CPU 等。与同一级别的同类处理器相比,不同的适合用途的内核为 SoC 提供了更大的灵活性,因此在更广泛的工作负载范围内具有更高的性能和更低的功耗。

但是,当您开始考虑基于边缘的AI计算机视觉等应用程序的要求时,事实是I / O和内存变得与原始处理性能一样严格,如果不是更多的话。

“内存速度只会上升得这么快,对吧?”,英伟达副总裁兼嵌入式与边缘计算总经理Deepu Talla说。“它没有呈指数级增长。由于大小的原因,位宽大致相同:它是16位,32位,64位,128位,等等。大多数嵌入式处理器通常具有32位甚至16位接口,这也是由于成本和尺寸的原因。

“记忆的速度每一代只增长2倍,这通常每三年发生一次,”他继续说道。“但是,SoC中的计算要求可能增加了10倍或20倍。

您如何协调计算性能的不成比例的提高与内存技术相对较小的进步?特别是随着处理器演变成独特的逻辑集合,这些逻辑集合都需要自己访问内存等资源。

根据塔拉的说法,你把它给他们。以下是嵌入式存储器架构为满足下一代异构多核处理器的需求而不断发展的三种方式。

#1.特定于内核的静态存储器

“如果你看看很多这样的嵌入式处理器,它们过去一直都有SRAM,”Talla说。“现在,对于每个特定的单元,我们有本地SRAM,它从DRAM获取数据,将其存储在本地并进行处理,然后发回最终输出。

特定于内核的SRAM具有一些优势,首先是无需将临时数据写回片外DRAM所带来的内存性能提升。

这种架构还具有降低功耗的额外好处,因为极低电压的SRAM模块位于SoC中相应的逻辑IP附近或附近。

“如果你去DRAM,那可能是一个数量级的功率,所以你实际上通过使用这些技术来节省功率,”Talla解释说。

#2.增加系统内存

如今,嵌入式处理器具有多达 4 MB 至 8 MB 的系统内存。此系统内存不专用于任何一个特定内核,并且可以在 CPU、GPU 和加速器等元素之间共享。

与专用SRAM类似,更多共享系统内存的主要好处是更少的DRAM访问。例如,传统的视频编码序列如下所示:

数字内存 -》 视频编码器 -》 数字内存 -》 附加计算 -》 DRAM

增加的系统缓存可实现以下功能:

DRAM -》 视频编码器 -》 系统内存 -》 附加计算 -》 DRAM

如前所述,不同之处在于单独的内核不必不断从片外DRAM获取数据,因为大型系统内存消除了对中间步骤的需求。

#3.增加的缓存大小

最后,随着较新的处理技术使更高容量的内存更实惠,缓存大小将不可避免地增加。在异构 SoC 上为 CPU、GPU、DSP 和其他核心架构提供更大的缓存也将减少 DRAM 流量。

将增加的缓存大小与前两项改进相结合,开始产生一些重大收益。

Talla指出:“更多的SRAM,通用的系统内存,以及更多的高容量缓存,可以让你在未来三到五年内将性能提高10倍到100倍,即使内存带宽可能只增加了一倍或四倍。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20332

    浏览量

    254980
  • 嵌入式
    +关注

    关注

    5209

    文章

    20656

    浏览量

    337036
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5271

    浏览量

    136069
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华北工控SOMB-6581嵌入式核心板:以RK3588多核异构架构赋能关键行业智能化升级

    近期,华北工控正式推出搭载RK3588多核异构处理器的SOMB-6581嵌入式核心板,凭借其灵活定制能力、工业级稳定特性及强大的AI算力支持,迅速成为工业自动化、智慧交通、智慧医疗等关键行业
    的头像 发表于 04-24 11:28 645次阅读

    2025嵌入式开发教程|远航哥

    的"语言"。作为从业者,我见证了串口、I2C和SPI这三种主流协议在不同场景下的应用与演进。它们各自独特的物理层设计、协议机制和适用场景,构成了嵌入式通信的大支柱。 串口通信:最古老的现代协议 串口通信(UART)堪称电子通信
    的头像 发表于 03-20 17:35 1327次阅读
    2025<b class='flag-5'>嵌入式</b>开发教程|远航哥

    施耐德电气揭秘弘昇实现业务规模十倍跨越的成长密码

    作为系统集成商的优秀代表,弘昇与施耐德电气已携手合作余年,从2014年签约额仅三百万人民币的初创企业,到2023年整体销售额突破亿元大关,实现业务规模十倍跨越,2024年更保持营业额翻倍的强劲
    的头像 发表于 01-24 16:51 2258次阅读

    arm嵌入式主板优缺点

    设备里面做控制、数据处理使用的CPU板。一般作为工控主板使用。   ARM处理器是一16/32位的嵌入式RISC微处理器,具有低成本、高性能、低功耗的特点。ARM9系列微处理器具有以下特点:支持
    发表于 01-08 07:08

    嵌入式中的浮点型数据转换为字节类型的三种方法

    。double类型也是如此最多可以保存小数点后15位小数。 float 优点:省内存,运算速度快。 float 缺点:精度低。 double 优点:精度高。 double 缺点:占内存,运算速度慢。 在嵌入式编程
    发表于 01-07 06:28

    嵌入式系统中,动态分配内存可能发生的问题是什么?

    尽管不像非嵌入式计算机那么常见,嵌入式系统还是有从堆(heap)中动态分配内存的过程的。 那么嵌入式系统中,动态分配内存可能发生的问题是什
    发表于 12-22 09:42

    嵌入式和FPGA的区别

    嵌入式系统与FPGA的核心差异:软件定义功能VS硬件可重构。嵌入式适合通用计算,开发门槛低;FPGA凭借并行处理实现纳秒级响应,但成本高、开发难。二者融合的SoC器件正成为未来趋势,平衡性能
    发表于 11-19 06:55

    【玩转多核异构】T153核心板RISC-V核的实时性应用解析

    飞凌嵌入式FET153-S核心板的异构多核架构展现出了卓越的通信性能,能够为诸多应用提供高效可靠的核心支撑,特别适用于对实时性和稳定性要求极高的智能应用场景。
    的头像 发表于 11-14 09:40 9331次阅读
    【玩转<b class='flag-5'>多核</b><b class='flag-5'>异构</b>】T153核心板RISC-V核的实时性应用解析

    嵌入式达到什么水平才能就业?

    、LoRa、NB-IoT,能实现嵌入式设备与云端平台的数据交互了解 RTOS 实时操作系统:如 FreeRTOS、RT-Thread,能进行任务创建、信号量管理、内存分配
    发表于 09-15 10:20

    RK3506开发板:开启嵌入式系统新时代

    系统的新时代。 性能卓越:创新架构引领潮流 RK3506开发板采用的核A7+单核M0多核异构架构,是其在性能
    的头像 发表于 08-13 17:18 737次阅读

    【老法师】多核异构处理器中M核程序的启动、编写和仿真

    文章,小编就将以飞凌嵌入式的OKMX8MP-C开发板为例,为大家介绍多核异构处理器M核程序的启动配置、程序编写和实时仿真的过程。
    的头像 发表于 08-13 09:05 4200次阅读
    【老法师】<b class='flag-5'>多核</b><b class='flag-5'>异构</b>处理器中M核程序的启动、编写和仿真

    嵌入式和单片机,是同一个东西吗?

    嵌入式系统的设计和实现需要考虑功耗、尺寸、成本和性能以外的其他因素,如可靠性、安全性和实时性。此外,嵌入式系统通常不具备频繁升级软硬件的能力,一旦部署,它们需要在较长的时间内稳定运行
    发表于 07-09 10:20

    Linux嵌入式和单片机嵌入式的区别?

    Linux嵌入式与单片机嵌入式在多个方面存在显著的区别,以下是详细的比较和归纳: 一、基本概念 1. Linux嵌入式: 定义:将Linux操作系统运行在嵌入式设备上的一
    发表于 06-20 09:46

    嵌入式力矩电机的设计方法研究

    摘 要:介绍一用于机床直驱部件的嵌入式力短电机的设计和电磁结构优化方法。为了使嵌入式力矩电机满足机床内部结构紧凑的要求,必须具有较高的磁密。通过计算分析,得到不同长径比、不同磁极对数
    发表于 06-11 15:08

    精选好文!噪声系数测量的三种方法

    本文介绍了测量噪声系数的三种方法:增益法、Y系数法和噪声系数测试仪法。这三种方法的比较以表格的形式给出。 在无线通信系统中,噪声系数(NF)或者相对应的噪声因数(F)定义了噪声性能和对接
    发表于 05-07 10:18