0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

网络和x86处理器在嵌入式网络应用中协同工作

星星科技指导员 来源:嵌入式计算设计 作者:John D'Ambrosia 2022-06-23 10:34 次阅读

x86 架构如今广泛用于许多嵌入式应用程序中。工程师产品经理认识到,这些设备为其产品提供了市场领先的计算性能、具有向后兼容性的频繁创新、低风险的供应连续性、高效的功耗、支持的开发工具和软件以及一系列价格选择。

利用这些优势增长最快的领域是嵌入式网络通信设计。在这方面,x86 处理器非常适合 10/100 Mbps 和 1 Gbps 应用。然而,随着网络扩展到 10G、40G 和 100G,需要一种新的架构来增强 x86 的高性能应用程序。

要求强调 x86 能力

新设计有几个强调 x86 架构功能的关键要求:

更高的性能:永远不变的一个要求是对更高性能的需求。随着更多用户和更多在线设备、更多需要带宽的应用(如视频)以及用于移动和云计算应用的新网络,对网络带宽的需求是无法满足的。看不到尽头,网络已经从 10/100/1000 以太网转移到 Nx1G 和 10G,40G 和 100G 即将到来。性能要求不仅限于增加原始带宽,还必须提供非常低的延迟来处理实时应用程序。最后,正在引入复杂的流量管理,以在数千种类型的应用程序之间提供流量排队、调度、整形和监管。

安全处理:网络安全曾经是罕见的,设计通过带外或后备异常路径上的专用安全处理器来解决这个问题。在现代设计中,用于计算密集型批量加密功能的线速安全处理和加速有望在每个数据包上在线提供。

深度数据包检测:深度数据包检测和 L4-L7 数据包处理在历史上也被视为异常,由单独的外部处理器和正则表达式引擎处理。现代设计中的许多用例需要能够对数据包中包含的信息做出安全和网络处理决策,远远超出原始 L2-L3 标头信息。

编程性:可以在网络上找到的应用程序和威胁列表每天都在增加。网络基础设施和安全设备的产品设计必须是高度可编程的,以适应新的要求,而没有很大的成本或时间限制。

功率效率:为了满足新的绿色计算要求,增加带宽和每个数据包的计算量并不能驱动功率的线性或指数增长。新设计必须扭转功耗的增长率,推动每瓦指令的新水平。

有状态处理:几乎所有关于深度数据包检查、负载平衡和安全处理的要求都需要对整个通信会话有状态、基于流的视图。简单的数据包处理不再足够好,当前的 OpenFlow 规范定义了 10 元组匹配标准。

这些新要求的结合产生了对更大带宽的需求,并且每个数据包的处理量显着增加。这些项目中的任何一项都可能成为通用处理器的挑战,而这些新要求的结合给 x86 在嵌入式通信设计中带来了巨大压力,这些设计超出了几千兆位的性能。

x86 硬缓存墙

x86 处理器非常适合许多网络和安全应用程序的通用计算要求。不幸的是,它也成为高性能设计的瓶颈。x86 以及其他基于缓存的架构(如 MIPS)无法同时处理高数据包速率 I/O、安全处理和深度数据包检测等操作。

在 10G、40G 和 100G 中,这种动作组合为每个数据包定义了非常高的接触率和指令,这些数据包定义了流的越来越多的有状态系列数据包。在这些场景中,内存事务率和网络吞吐量之间的差距很明显。隐藏内存延迟的标准方法(例如多层缓存)变得无效。

如果保守地假设只需要 500 字节 (0.5 KB) 的内存来维护流的状态信息,这意味着需要 0.5 GB 来保持缓存的有用性。这比当前顶级 x86 CPU 中提供的 12 MB 缓存高出几个数量级。

最近公布的测试结果如图 1 所示,清楚地说明了当今领先的基于 x86 的 CPU 的局限性。

poYBAGKz0UiANef4AAP6ktn02bA022.png

结果表明,随着有状态流数量的增加,通用 CPU 的性能会大幅下降。

一种新的架构

流处理技术的最新进展使设计人员能够利用 x86 提供的众多优势,并将其扩展到 10G、40G 和 100G 设计中。图 2 所示的新架构提供了多个特定于工作负载的处理器,可最大限度地提高每个关键设计任务的性能。它具有专门的网络优化协处理器,通过消除不适合的低效和繁重的工作负载来增强 x86。该设计保留了 x86 对所有应用程序和控制平面处理的优势和熟悉度。同时,它提供了一系列功能强大的专用多核 RISC 处理器,这些处理器针对网络和安全工作负载进行了优化。

图 2:典型的异构多核设计将 x86 处理器集中在应用程序和控制平面处理上,将繁重的网络和安全工作负载留给专用协处理器。

pYYBAGKz0VSACTBjAA8yuWJUD3w644.png

这些流处理器处理较低层的数据包处理并加速较高层的流和应用程序级处理。这种加速架构利用网络优化核心进行交换和路由、数据包分类、过滤、状态流分析、深度数据包检测和基于动态流的负载平衡。还可以执行其他网络处理功能,例如 TCP 终止和 SSL 卸载,进一步卸载通用 CPU。流量可以清晰地结构化,以便从流处理器传输到通用核心以进行应用程序处理,从而提高主机性能。最后,数据平面流处理器与应用程序和控制平面处理器之间的所有通信都可以通过虚拟化、

异构多核设计的应用

许多网络和安全产品都非常适合这种异构多核设计,它提供一流的 x86 处理和新的状态流处理。流和活动状态的概念可以在防火墙、会话边界控制器、入侵防御系统、负载平衡器以及许多其他网络和安全设备中找到。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    17943

    浏览量

    221419
  • 控制器
    +关注

    关注

    112

    文章

    14947

    浏览量

    170216
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10301

    浏览量

    206122
收藏 人收藏

    评论

    相关推荐

    INT8量子化PyTorch x86处理器

    INT8量子化PyTorch x86处理器
    的头像 发表于 08-31 14:27 450次阅读
    INT8量子化PyTorch <b class='flag-5'>x86</b><b class='flag-5'>处理器</b>

    ARM Cortex-M33处理器数据表

    ARM Cortex-M33处理器是第一款ARMv8-M处理器,旨在满足嵌入式和物联网市场,特别是那些需要高效安全或数字信号控制的市场。 ARMv8-M引入了TrustZone,这构成了嵌入式
    发表于 08-28 06:12

    Arm Cortex-M23处理器产品介绍

    ARM Cortex-M23处理器是一款非常紧凑的两级流水线处理器,支持ARMv8-M基准架构。 配备TrustZone的Corest-M23是最受限制的物联网和嵌入式应用程序的理想处理器
    发表于 08-25 06:19

    ARM Cortex-R52处理器技术参考手册

    Cortex-R52处理器是一款中等性能的有序超标量处理器,主要用于汽车和工业应用。 它还适用于各种其他嵌入式应用,如通信和存储设备。 Cortex-R52处理器有一到四个内核,每个内
    发表于 08-18 07:07

    Arm Cortex-R82处理器技术参考手册

    本手册,以下术语指的是下面提供的描述。 核心A核心包括与数据处理单元、存储系统和管理、电源管理以及核心级调试和跟踪逻辑相关的所有逻辑。 Cortex®-R82
    发表于 08-17 08:02

    ARM Cortex-M7处理器参考手册

    和纠正的纠错码(ECC)功能在实现时包括在数据和指令高速缓存。 Tcm接口支持实施外部ECC,以提供更高的可靠性并满足与安全相关的应用。 Cortex-M7处理器包括可选的浮点算术功能,支持单精度和双精度算术。 请参见第8章浮点单元。 该
    发表于 08-17 07:55

    Arm Cortex-R82处理器技术参考手册

    Cortex®-R82处理器是一款中等性能的多核有序超标量处理器,适用于实时嵌入式应用。 Cortex®-R82处理器采用ARM®V8-R AArch64架构。 ARM®V8-R AA
    发表于 08-17 07:45

    ARM Cortex-M23处理器技术参考手册

    Cortex-M23处理器是一款低门数、两级和高能效处理器。 它适用于微控制和深度嵌入式应用,这些应用需要在安全性是重要考虑因素的环境中使用区域优化的低功耗
    发表于 08-17 07:28

    Arm Cortex®-M33处理器技术参考手册

    Cortex®-M33处理器是一款低门数、高能效的处理器,适用于微控制和深度嵌入式应用。 该处理器基于ARM®V8-M架构,主要用于安全性
    发表于 08-17 07:23

    Arm Cortex-R52处理器技术参考手册

    Cortex-R52处理器是一款中等性能的有序超标量处理器,主要用于汽车和工业应用。 它还适用于各种其他嵌入式应用,如通信和存储设备。 Cortex-R52处理器有一到四个内核,每个内
    发表于 08-17 06:24

    ARM Cortex-M85处理器软件优化指南

    )功能,该功能实现大多数处理器逻辑的冗余拷贝。 为了支持Arm自定义指令(ACI),处理器包括可选的自定义数据路径扩展(CDE)模块,这些模块嵌入逻辑
    发表于 08-10 07:43

    ARM Cortex-M85处理器技术参考手册

    功能。 设计的重点是计算机应用,如数字信号处理(DSP)和机器学习。Cortex®-M85处理器能效高,标量和向量运算实现高计算性能,同时保持低功耗。
    发表于 08-09 07:28

    GAUDIR HL-2000处理器介绍

    和HL-200 PClecard都包含一个GAUDIR HL-2000处理器,该处理器包含一个由八个完全可编程张量处理核心(TPC 2.0)组成的集群。TPC核心是C可编程的,为用户提供了最大的创新灵活性
    发表于 08-04 07:23

    D-2700和D-1700处理器产品资料

    IntelXeon@D-2700和D-1700处理器为云、边缘和5G网络提供突破性的、密度优化的性能、可扩展性和价值。intel Xeon D集成了以太网和加速处理器,用于支持
    发表于 08-04 07:07

    处理器架构的后起之秀——RISC-V

    Intel 8086处理器。那时候的他们和微软公司达成合作,几乎垄断了所有个人计算机的软硬件市场,挣得是盆满钵满。经过多年的发展,x86的架构从16位一直发展到64位,几乎所有的个人电脑都是
    发表于 04-14 10:53