0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为异构多核实现十倍嵌入式内存性能的三种方法

星星科技指导员 来源:嵌入式计算设计 作者:Brandon Lewis 2022-06-02 09:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

从理论上讲,异构多核设备可以配备一个计算块,该计算块针对给定用例的任何类型的操作进行了优化。用于视频处理的 GPU、用于对象识别的神经网络处理器、运行操作系统CPU 等等。与同级别的同质处理器相比,不同用途的内核为 SoC 提供了更大的灵活性,因此在更广泛的工作负载范围内具有更高的性能和更低的功耗。

但当您开始考虑基于边缘的 AI计算机视觉等应用程序的要求时,事实是 I/O 和内存变得与原始处理性能一样受到限制,甚至更多。

“内存速度只会这么快,对吧?” 英伟达嵌入式与边缘计算副总裁兼总经理 Deepu Talla “它并没有呈指数级增长。由于大小,位宽大致相同:它可以是 16 位、32 位、64 位、128 位,等等。大多数嵌入式处理器通常具有 32 位甚至 16 位接口,这也是出于成本和尺寸的原因。

“内存的速度只是一代比一代增长 2 倍,而且这通常每三年发生一次,”他继续说道。“然而,SoC 中的计算需求可能增加了 10 倍或 20 倍。”

您如何协调计算性能的这种不成比例的增长与内存技术的相对较小的进步?特别是当处理器演变成独特的逻辑集合时,它们都需要自己访问内存等资源。

根据塔拉的说法,你把它给了他们。以下是嵌入式存储器架构为满足下一代异构多核处理器的需求而发展的三种方式。

1、内核专用 SRAM

“如果你看很多这些嵌入式处理器,它们过去一直都有 SRAM,”Talla 说。“现在,对于每个特定单元,我们都有本地 SRAM,它从 DRAM 获取数据,在本地存储并处理它,然后发回最终输出。”

特定于内核的 SRAM 提供了几个优势,首先是由于不必将临时数据写回片外 DRAM 所带来的内存性能提升。

这种架构还具有降低功耗的额外好处,因为超低电压 SRAM 模块位于 SoC 内相应的逻辑 IP 附近或附近。

“如果你使用 DRAM,这可能是一个数量级的功率,所以你实际上是通过使用这些技术来节省功率,”Talla 解释道。

2、增加系统内存

今天的嵌入式处理器具有高达 4 MB 到 8 MB 的系统内存。此系统内存并非专用于任何特定内核,并且可以在 CPU、GPU 和加速器等元素之间共享。

与专用 SRAM 类似,更多共享系统内存的主要好处是更少的 DRAM 访问。例如,传统的视频编码序列如下所示:

DRAM -》 视频编码器 -》 DRAM -》 附加计算 -》 DRAM

增加的系统缓存可以实现这一点:

DRAM -》 视频编码器 -》 系统内存 -》 附加计算 -》 DRAM

如前所述,不同之处在于单独的内核不必不断地从片外 DRAM 中获取数据,因为大系统内存消除了对中间步骤的需要。

3、增加缓存大小

最后,随着更新的工艺技术使更高容量的内存更便宜,缓存大小将不可避免地增加。在异构 SoC 上发现的用于 CPU、GPU、DSP 和其他核心架构的更大缓存也将减少 DRAM 流量。

并且将增加的缓存大小与前两个进步配对开始产生一些重大收益。

“更多的 SRAM、通用的系统内存以及更多的大容量缓存可以让您在接下来的三到五年内将性能提高 10 倍到 100 倍,即使内存带宽可能只增加了一倍或四倍,”Talla 指出出去。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5209

    文章

    20656

    浏览量

    337036
  • DRAM
    +关注

    关注

    41

    文章

    2402

    浏览量

    189567
  • 编码器
    +关注

    关注

    45

    文章

    4011

    浏览量

    143361
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华北工控SOMB-6581嵌入式核心板:以RK3588多核异构架构赋能关键行业智能化升级

    近期,华北工控正式推出搭载RK3588多核异构处理器的SOMB-6581嵌入式核心板,凭借其灵活定制能力、工业级稳定特性及强大的AI算力支持,迅速成为工业自动化、智慧交通、智慧医疗等关键行业
    的头像 发表于 04-24 11:28 645次阅读

    嵌入式人工智能课程(华清远见)

    内存紧张、功耗严苛的嵌入式设备上,如何让动辄数百万参数的深度学习模型跑得快、跑得稳?答案的核心,正是“嵌入式 AI 编译器”。近日,华清远见推出了一门深度聚焦 AI 编译器优化的硬核课程,
    发表于 04-16 18:47

    2025嵌入式开发教程|远航哥

    的"语言"。作为从业者,我见证了串口、I2C和SPI这三种主流协议在不同场景下的应用与演进。它们各自独特的物理层设计、协议机制和适用场景,构成了嵌入式通信的大支柱。 串口通信:最古老的现代协议 串口通信(UART)堪称电子通信
    的头像 发表于 03-20 17:35 1327次阅读
    2025<b class='flag-5'>嵌入式</b>开发教程|远航哥

    施耐德电气揭秘弘昇实现业务规模十倍跨越的成长密码

    作为系统集成商的优秀代表,弘昇与施耐德电气已携手合作余年,从2014年签约额仅三百万人民币的初创企业,到2023年整体销售额突破亿元大关,实现业务规模十倍跨越,2024年更保持营业额翻倍的强劲
    的头像 发表于 01-24 16:51 2258次阅读

    arm嵌入式主板优缺点

    设备里面做控制、数据处理使用的CPU板。一般作为工控主板使用。   ARM处理器是一16/32位的嵌入式RISC微处理器,具有低成本、高性能、低功耗的特点。ARM9系列微处理器具有以下特点:支持
    发表于 01-08 07:08

    嵌入式中的浮点型数据转换为字节类型的三种方法

    。double类型也是如此最多可以保存小数点后15位小数。 float 优点:省内存,运算速度快。 float 缺点:精度低。 double 优点:精度高。 double 缺点:占内存,运算速度慢。 在嵌入式编程
    发表于 01-07 06:28

    嵌入式系统中,动态分配内存可能发生的问题是什么?

    尽管不像非嵌入式计算机那么常见,嵌入式系统还是有从堆(heap)中动态分配内存的过程的。 那么嵌入式系统中,动态分配内存可能发生的问题是什
    发表于 12-22 09:42

    嵌入式和FPGA的区别

    嵌入式系统与FPGA的核心差异:软件定义功能VS硬件可重构。嵌入式适合通用计算,开发门槛低;FPGA凭借并行处理实现纳秒级响应,但成本高、开发难。二者融合的SoC器件正成为未来趋势,平衡性能
    发表于 11-19 06:55

    【玩转多核异构】T153核心板RISC-V核的实时性应用解析

    飞凌嵌入式FET153-S核心板的异构多核架构展现出了卓越的通信性能,能够为诸多应用提供高效可靠的核心支撑,特别适用于对实时性和稳定性要求极高的智能应用场景。
    的头像 发表于 11-14 09:40 9331次阅读
    【玩转<b class='flag-5'>多核</b><b class='flag-5'>异构</b>】T153核心板RISC-V核的实时性应用解析

    嵌入式达到什么水平才能就业?

    、LoRa、NB-IoT,能实现嵌入式设备与云端平台的数据交互了解 RTOS 实时操作系统:如 FreeRTOS、RT-Thread,能进行任务创建、信号量管理、内存分配
    发表于 09-15 10:20

    【老法师】多核异构处理器中M核程序的启动、编写和仿真

    文章,小编就将以飞凌嵌入式的OKMX8MP-C开发板例,大家介绍多核异构处理器M核程序的启动配置、程序编写和实时仿真的过程。
    的头像 发表于 08-13 09:05 4200次阅读
    【老法师】<b class='flag-5'>多核</b><b class='flag-5'>异构</b>处理器中M核程序的启动、编写和仿真

    嵌入式和单片机,是同一个东西吗?

    设计中,通常会使用特定的硬件和软件技术来满足其应用需求。例如,嵌入式处理器和微控制器(MCU)被设计在有限的资源下运行,包括有限的内存和处理能力。为了优化性能
    发表于 07-09 10:20

    Linux嵌入式和单片机嵌入式的区别?

    Linux嵌入式与单片机嵌入式在多个方面存在显著的区别,以下是详细的比较和归纳: 一、基本概念 1. Linux嵌入式: 定义:将Linux操作系统运行在嵌入式设备上的一
    发表于 06-20 09:46

    嵌入式力矩电机的设计方法研究

    摘 要:介绍一用于机床直驱部件的嵌入式力短电机的设计和电磁结构优化方法。为了使嵌入式力矩电机满足机床内部结构紧凑的要求,必须具有较高的磁密。通过计算分析,得到不同长径比、不同磁极对数
    发表于 06-11 15:08

    精选好文!噪声系数测量的三种方法

    本文介绍了测量噪声系数的三种方法:增益法、Y系数法和噪声系数测试仪法。这三种方法的比较以表格的形式给出。 在无线通信系统中,噪声系数(NF)或者相对应的噪声因数(F)定义了噪声性能和对接
    发表于 05-07 10:18