0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用虚拟化最大化多核SoC性能

星星科技指导员 来源:嵌入式计算设计 作者:Jim Ready,Patrick M 2022-06-14 14:55 次阅读

无论软件开发人员喜不喜欢,也不管他们是否为此做好准备,几乎每个称职的半导体制造商都在生产多核片上系统 (SoC)。这些 SoC 通常将两个或更多 CPU 内核与额外的特定应用硬件加速器配对,以提供完整的系统。例如,Cavium Networks、NetLogic Microsystems 和 Freescale Semiconductor 生产用于网络处理的 SoC,而德州仪器和 Broadcom 则生产用于数字媒体设备的 SoC。

对于软件人员来说,这提出了一个有趣的挑战,即使应用程序能够从这些多核 SoC 环境中获得所有可用的处理能力。开发人员如何确保他们的应用程序与可用内核线性扩展,并充分利用媒体加速器和数据包引擎等其他 SoC 硬件组件?需要明确的是,对于许多应用程序来说,可扩展性问题仍然是一个真正的科学项目。然而,有一些系统要构建和产品要发布,所以开发人员不能等待理论上完美的解决方案。

在过去的一年中,MontaVista Software 研究了广泛的应用程序中的大量客户用例,包括网络处理、数字电视、车载信息娱乐、超低功耗服务器 Web 托管等。目标是了解基于 Linux 的软件解决方案如何在广泛的应用需求中充分利用底层 SoC 硬件。该研究确定了任何解决方案都必须满足的以下高级要求。

多核支持

现代嵌入式系统的需求正在加速采用多核 SoC。同时运行多个系统的要求进一步强调了这些要求;因此,该解决方案必须提供一种使用和管理多核环境的有效方式。

安全

根据定义,下载到设备的任何内容都是不安全的。该解决方案必须有效隔离从核心设备功能下载的任何内容,并且不得允许下载的应用程序污染其他应用程序。

资源拥塞

必须防止下载的应用程序占用系统资源。目标是有效地共享内存、CPU 时间和 I/O 等资源。这种共享必须允许更重要的系统功能优先于不太重要的下载应用程序。

国外系统集成

许多环境运行在 Linux 内核之上。但是,这些环境可能需要不同的用户空间库以及不同的内核补丁。例如,Android 系统有自己的设备驱动程序和内核补丁。理想情况下,系统可以运行在 Linux 内核上运行的任何用户空间。与这些环境相关的内核补丁和用户空间必须与安全性和资源共享相结合。

这种分析促成了基于 Linux 的架构的开发,该架构最大限度地发挥了当今强大的多核 SoC 的底层功能。

架构概述

要了解该软件的整体架构,有必要了解一些现代操作系统 (OS) 环境,尤其是虚拟化技术。但小心点; 围绕虚拟化有很多炒作(或者,正如我们喜欢说的,围绕虚拟机管理程序有很多炒作)。

虚拟化是一种将计算机资源划分为多个执行环境的方法。目前使用的虚拟化主要分为三大类,它们之间的主要区别在于发生虚拟化的层:

全虚拟化和半虚拟化:这些类型的虚拟化用于托管多个相互隔离的客户操作系统。虽然功能强大,但由于管理程序和多个操作系统的开销,性能(没有大量优化)非常低。示例包括 QEMU、基于内核的虚拟机 (KVM)、Zen 和 VMware。

操作系统资源虚拟化:这种类型的虚拟化用于隔离和扩展使用单个操作系统的应用程序。这里的优势是单一操作系统和较低的开销,在大多数情况下通常不到 1%。因为开销很小,所以扩展和/或优化性能的能力是一个巨大的好处。示例包括 Linux 容器和 BDS Jails。

硬件分段(非对称多处理或 AMP):这种高性能配置将硬件专用于在用户模式下运行的特定应用程序,以获得最佳性能。这可以通过使用简单的运行时执行程序或利用操作系统资源虚拟化和处理器内核关联功能将内核和 I/O 专用于进程而几乎没有开销来实现。

这些类型的虚拟化提供不同的性能特征,需要不同的设置和维护开销,将独特级别的复杂性引入运行时环境,并解决不同的问题。

虽然业界目前专注于推动完全虚拟化的管理程序作为多核优化的万能解决方案,但现实情况是嵌入式开发人员需要一系列可针对特定应用程序需求量身定制的选项。开发人员将需要一种或多种这些虚拟化技术的某种组合,以提供符合硬件限制并满足设计性能特征的产品。简而言之,诀窍是将应用程序与正确的操作系统服务相匹配,以满足整体系统要求,包括性能、可靠性和安全性。

MontaVista 提供三种基于非专有、开源 Linux 技术的虚拟化方法,并支持多处理器架构。因为它是单个运行时,所以有一个编译器和一组工具可用于任何用例或用例组合。图 1 显示了这种方法的总体情况。这三种方法是:

KVM Hypervisor(完全虚拟化)

Linux 容器(操作系统资源虚拟化)

MontaVista Bare Metal Engine(操作系统资源虚拟化和 SoC 硬件分割)

图 1:一个编译器和一组工具可用于任何用例或使用 MontaVista 的三种虚拟化方法的组合。

pYYBAGKoMOuAN8MwAAYmv9P3H98049.png

微服务器用例

微服务器背后的想法是利用更小、更节能的处理器来降低一类以 Web 为中心的 IT 应用程序的物理和能源消耗足迹。对于某些工作负载,几个低功耗处理器可能比更少、更强大的处理器更高效。Cavium Octeon 处理器和其他半导体供应商的处理器非常适合在内核本身的功率效率的基础上满足微服务器概念的密度和功率效率要求。这些 SoC 还包括专用硬件来处理基于 Web 的应用程序所需的前端安全和加密/解密处理。

从软件的角度来看,MontaVista Linux Containers 和 Bare Metal Engine 技术有助于完成这幅画。容器用于提供操作系统级别的虚拟化,允许对工作负载要求进行非常有效的虚拟化。例如,容器可用于托管数千个独立网站,每个网站彼此安全隔离。容器允许精确控制分配给每个容器的运行时资源,因此每个网站都可以限制在客户购买的性能水平上。或者,更重要的是,可以使用相同的机制阻止流氓网站过度消耗资源,从而阻止拒绝服务类型的攻击。

Bare Metal Engine 为每个托管网站所需的安全和加密/解密操作提供运行时环境。例如,一个 32 核的 SoC 可以利用大部分核心进行应用程序处理,而少数专用于数据包处理,所有这些都由一个 Linux 实例控制。

Linux 提供了一个简单的解决方案

人们普遍认为,必须利用 Linux 与实时操作系统 (RTOS) 或简单的运行时环境的组合来充分实现多核处理器的高性能。助长这种误解的想法是,Linux 本身无法满足要求,因为它太大、太慢且不是实时的。这种谬误还推动了管理程序和/或虚拟化必须调解和隔离不同的运行时环境并促进它们之间的相互通信的要求。通常是 RTOS 供应商自己使这种错误信念永久化。

最后,这些对 Linux 驱动器的误解增加了开发过程的复杂性和成本。由于多个运行时和开发环境(Linux、RTOS 和可能的管理程序各一个),复杂性增加。由于专有 RTOS 和虚拟机管理程序的特许权使用费,成本增加,更不用说开发复杂性本身带来的额外成本,需要更多的开发人员在更长的时间内。

在任何地方都使用 Linux 并在可能无法满足某些要求的地方对其进行修复的方法会产生单一的操作系统环境、单一的工具链以及适用于应用程序所有方面的通用开发和调试工具。正如爱因斯坦所说,“让一切尽可能简单,但不要简单。”

作者:Jim Ready,Patrick MacCartee

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 驱动器
    +关注

    关注

    51

    文章

    7382

    浏览量

    143190
  • Linux
    +关注

    关注

    87

    文章

    11000

    浏览量

    206813
  • RTOS
    +关注

    关注

    20

    文章

    776

    浏览量

    118827
收藏 人收藏

    评论

    相关推荐

    如何让单片机的IO口利用最大化

    首先,LED亮起时完全由单片机的GPIO输出电流,所以对于GPIO的电流驱动能力有一定的要求。设计电路时要注意查询自己使用的MCU的电流驱动能力。
    发表于 04-29 14:29 190次阅读
    如何让单片机的IO口利用<b class='flag-5'>最大化</b>

    PCB设计优化指南:如何最大化EMC性能效果?

    电源平面与GND平面相邻,平面间距离很小,有最佳的磁通抵消效果和低的电源平面阻抗。主电源及其对应的地布在4、5层,层厚设置时,增大S2-P之间的间距,缩小P-G2之间的间(相应缩小G1-S2层之间的间距),以减小电源平面的阻抗,减少电源对S2的影响。
    发表于 04-08 14:22 389次阅读
    PCB设计优化指南:如何<b class='flag-5'>最大化</b>EMC<b class='flag-5'>性能</b>效果?

    用于并行采样的EVADC同步转换,如何在最大化采样率的同时最大限度地减少抖动?

    ; 必须设置相位同步器才能让 EVADC 达到其有记录的性能。" SSE=0、USC=1 设置会降低 ADC 结果精度吗? 请告知最适合我的手机壳的设置是什么? 为了实现最小的抖动、最大的采样率和最准确的结果,我还应该考虑什么?
    发表于 01-18 07:59

    使用GaN HEMT设备最大化OBCs的功率密度

    随着电动汽车(EVs)的销售量增长,整车OBC(车载充电器)的性能要求日益提高。原始设备制造商正在寻求最小化这些组件的尺寸和重量以提高车辆续航里程。因此,我们将探讨如何设计、选择拓扑结构,以及如何通过GaN HEMT设备最大化OBCS的功率密度。
    的头像 发表于 12-17 11:30 667次阅读
    使用GaN HEMT设备<b class='flag-5'>最大化</b>OBCs的功率密度

    伺服电机的编码器报废了怎么解决?

    由于电工接错线。伺服电机的编码器彻底坏了。电机部分完好。1.5kw@2000rpm。如何用通用矢量变频器拖动这个废物?要怎么调整重要参数?0到2赫兹会有好的性能吗?希望最大化发挥余热。
    发表于 11-14 07:31

    深开鸿亮相虎嗅2023工业AI大会,以开鸿安全数字底座助力工业场景价值最大化

    趋势、技术前沿和应用案例展开深入探讨。 深开鸿柴莹受邀参与此次大会,发表《融合AI,安全数字底座助力工业场景价值最大化》的主题演讲,分享了开鸿安全数字底座在工业领域融合AI技术的价值和实践经验,并在圆桌论坛环节探讨了工业领域开源软件的现状与机
    的头像 发表于 09-09 13:25 442次阅读

    深开鸿亮相虎嗅2023工业AI大会,以开鸿安全数字底座助力工业场景价值最大化

    前沿和应用案例展开深入探讨。深开鸿柴莹受邀参与此次大会,发表《融合AI,安全数字底座助力工业场景价值最大化》的主题演讲,分享了开鸿安全数字底座在工业领域融合AI技术的价
    的头像 发表于 09-09 08:35 853次阅读
    深开鸿亮相虎嗅2023工业AI大会,以开鸿安全数字底座助力工业场景价值<b class='flag-5'>最大化</b>

    电阻如何选才是最好的,欧姆定律怎么用才达到效果最大化

    电路电容DIY
    学习电子知识
    发布于 :2023年09月05日 21:13:36

    什么是服务器虚拟化?私人云服务器

    什么是 服务器虚拟化 ? 服务器虚拟化是一种将物理服务器转化为虚拟服务器的过程,使得多个虚拟服务器可以在同一台物理服务器上运行,从而实现服务器的最大
    的头像 发表于 08-08 10:44 882次阅读

    最大化数据库性能虚拟Red Hat Enterprise Linux环境

    电子发烧友网站提供《最大化数据库性能虚拟Red Hat Enterprise Linux环境.pdf》资料免费下载
    发表于 08-03 11:06 0次下载
    <b class='flag-5'>最大化</b>数据库<b class='flag-5'>性能</b>在<b class='flag-5'>虚拟</b>Red Hat Enterprise Linux环境

    Cortex-M如何最大限度地提高SoC设计的能效端点

    随着现代微控制器和SoC变得越来越复杂,设计者面临着最大化能源效率,同时实现更高水平的集成。最大限度地提高能量在低功耗SoC市场中,多个功率域的使用被广泛采用。在 同时,为了解决更高级
    发表于 08-02 06:34

    细说SPI主机发送性能最大化实现方案

    spififo的接口,并没用DMA来进行加速优化。本篇就是基于SPI配合DMA实现理论速度性能。二、问题点(一)SPIFIFOpoll阻塞发送无法发挥SPI理论速度性
    的头像 发表于 07-31 23:03 1570次阅读
    细说SPI主机发送<b class='flag-5'>性能</b><b class='flag-5'>最大化</b>实现方案

    设计大规模并行哈希图时的几个重要考虑事项

    在 GPU 上使用大规模并行哈希图实现性能最大化
    的头像 发表于 07-05 16:30 779次阅读
    设计大规模并行哈希图时的几个重要考虑事项

    最大化Rust性能:编译器优化的比较分析

    Rust以其独特的安全性、速度和并发性组合而迅速流行。但是与其它任何语言一样,要充分利用Rust需要的不仅仅是理解它的语法和习惯用法——还需要深入了解如何有效地利用和优化它的编译器。
    的头像 发表于 05-29 16:17 1486次阅读
    <b class='flag-5'>最大化</b>Rust<b class='flag-5'>性能</b>:编译器优化的比较分析

    最大化Rust性能:编译器优化的比较分析

    Rust以其独特的安全性、速度和并发性组合而迅速流行。
    的头像 发表于 05-29 15:31 954次阅读
    <b class='flag-5'>最大化</b>Rust<b class='flag-5'>性能</b>:编译器优化的比较分析