0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MbedTLS纯软件实现和使用i.MX RT芯片里的硬件加速器实现性能差异

恩智浦MCU加油站 来源:恩智浦MCU加油站 作者:恩智浦MCU加油站 2022-04-01 15:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近期有i.MX RT客户在集成OTASBL项目,实现产品的2nd bootloader时遇到了 MbedTLS库算法性能问题,客户想知道MbedTLS纯软件实现和使用i.MX RT芯片里的硬件加速器实现,在性能上差距有多大。

借着客户这个问题,我们今天就在i.MX RT上实测看一下两个方式的性能差异。

客户使用的是i.MX RT1170,这个型号上的硬件加速器是CAAM,相比前一代架构 i.MX RT10xx系列上的DCP有升级,我们今天把DCP和CAAM同时测一下。

一、MbedTLS算法库简介

MbedTLS(前身 PolarSSL)是一个开源的 SSL/TLS 算法库,最早由Arm公司开源和维护,现在已经移交 Trusted Firmware 社区维护。MbedTLS 开源仓库地址为:

项目地址:https://github.com/ARMmbed/mbedtls

MbedTLS代码由 C 语言写成,其以最小的编码占用空间实现了 SSL/TLS 功能及各种加密算法,易于理解、使用、集成和扩展,方便开发人员轻松地在嵌入式产品中使用 SSL/TLS 功能。

MbedTLS软件包主要提供了如下支持:

完整的SSL v3、TLSv1.0、TLSv1.1 和TLS v1.2 协议实现

X.509 证书处理

基于TCP 的TLS 传输加密

基于UDP 的DTLS(DatagramTLS)传输加密

其它加解密库实现

二、i.MX RT上的硬件加速器简介

1, i.MX RT10xx系列上的DCP

DCP 是 Data Co-Processor 的简称,从名字上看是个通用数据协处理器

在 i.MX RT1060 Security Reference Manual 中有一张系统整体安全架构简图,这个简图中标出了 DCP 模块的主要功能:CRC-32算法、AES算法、Hash算法、类DMA数据搬移。关于进一步用法,见痞子衡两篇旧文《i.MX RT10xx DCP使用时密钥注意事项》、《i.MX RT10xx DCP使用时Cache注意事项》。

77005016-b18c-11ec-aa7f-dac502259ad0.png

2, i.MX RT11xx系列上的CAAM

CAAM 是 Cryptographic Acceleration and Assurance Module 的简称,是个超全功能的安全算法加速器。在 i.MX RT1170 Security Reference Manual 中有一张系统整体安全架构简图,这个简图中标出了 CAAM 模块的主要功能,其在 DCP 已有功能上做了进一步扩展,丰富了算法支持。

7721f536-b18c-11ec-aa7f-dac502259ad0.png

三、对比常见算法的软硬件实现性能差异

1,官方SDK例程简介

想要在MCU 上跑 MbedTLS 算法,正常是需要先移植MbedTLS 源码的。但是恩智浦 i.MX RT官方SDK包里已经做好了移植,源码就放在 SDK_2.11.0_MIMXRT1xxx-EVKmiddlewarembedtls下面,所以我们省去了移植步骤。

注:在 SDK 2.11 版本里移植的是 MbedTLS 2.27.0。

此外官方SDK 里还提供给了如下两个关于 MbedTLS 的基础例程,其中 mbedtls_selftest 是遍历全部算法,检测算法执行正确性;mbedtls_benchmark则是提供全部算法的实际运行性能数据(编解码速率 KB/s)。

SDK_2.11.0_MIMXRT1xxx-EVKoardsevkmimxrt1xxxmbedtls_examplesmbedtls_selftest

SDK_2.11.0_MIMXRT1xxx-EVKoardsevkmimxrt1xxxmbedtls_examplesmbedtls_benchmark

2,在i.MX RT1060上实测

我们现在在 MIMXRT1060-EVK 板子上实测算法性能,就用mbedtls_benchmark 例程,选择 debug build,即让代码跑在 TCM 里,这样可以达到最好性能,不让存储器性能成瓶颈从而影响算法性能数据。此外i.MX RT1060 内核频率也是配到了最高 600MHz。

mbedtls_benchmark例程默认是启用硬件加速器 DCP 来实现算法的,因为我们要对比 MbedTLS 纯软件实现和 DCP 硬件实现性能差异,所以在测试纯软件方式时需要在工程源文件 MIMXRT1062_features.h 里将下面这个宏临时设为 0,这时候工程可能会编译不通过(代码链在 128KB ITCM 里),因为纯软件方式代码相比硬件驱动方式代码要大得多,此时可以在benchmark.c 或者 ksdk_mbedtls_config.h 注释掉一些算法执行来减少最终代码体(保留你感兴趣的算法)。

/*@briefDCPavailabilityontheSoC.*/

#defineFSL_FEATURE_SOC_DCP_COUNT(0)

算法性能数据跟 IDE 以及编译优化选项也有关系,我们这里选择了 IAR,优化选项分别测试了 None 以及 High Speed,NoSize constraints 两种,因为算法特别多,我们就摘比较常用的 SHA 和 AES,其对比结果如下:

7745ef04-b18c-11ec-aa7f-dac502259ad0.png

3,在i.MX RT1170上实测

与上一节同样的方法,在 MIMXRT1170-EVK 板子上也测一下,同样 mbedtls_benchmark 例程 debug build,注意 i.MX RT1170 是双核芯片,我们在 Cortex-M7 下做测试,将内核频率配到最高 996MHz。

测试i.MX RT1170 上纯软件方式时仅需要在工程选项预编译宏里将 CRYPTO_USE_DRIVER_CAAM去掉即可,当然也可以在 MIMXRT1176_cm7_features.h 里将下面这个宏临时设为 0,这时候没有代码空间顾虑,i.MX RT1170 上默认 ITCM 是 256KB。最终测试结果如下:

/*@briefCAAMavailabilityontheSoC.*/

#defineFSL_FEATURE_SOC_CAAM_COUNT(0)

7763e946-b18c-11ec-aa7f-dac502259ad0.png

四、性能测试总结

结论1:使用硬件加速器CAAM模块/DCP模块,相比MbedTLS 纯软件实现,对于大部分算法性能都会有提升,但具体提升比例因算法本身复杂度而异。

结论2:硬件加速器方式提升比例较大的是3DES/DES(近10倍)、AES/ECDSA/ECDHE(近7倍)、RSA(3-5倍)、SHA-1/256(近2倍)。

结论3:硬件加速器方式对于部分算法,测试数据长度越大(默认1KB buffer,比如调到10KB),性能提升更明显。

结论4:编译器优化等级设置对 MbedTLS 纯软件和硬件加速器方式都有一定影响。

最后需要强调一点,这些测试数据仅作为参考,不代表硬件模块的真实能力,仅仅是基于当前软件环境的测试结果。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    841

    浏览量

    40235
  • 算法
    +关注

    关注

    23

    文章

    4803

    浏览量

    98523
  • mbedTLS
    +关注

    关注

    0

    文章

    6

    浏览量

    1002

原文标题:对比MbedTLS算法库纯软件实现与i.MX RT上硬件加速器实现性能差异

文章出处:【微信号:NXP_SMART_HARDWARE,微信公众号:恩智浦MCU加油站】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    恩智浦全新i.MX 93W应用处理器重磅发布

    恩智浦半导体宣布推出i.MX 93W应用处理,进一步扩展其i.MX 93产品系列。这款i.MX 93W片上系统(SoC)专为加速物理AI的
    的头像 发表于 03-16 09:45 2128次阅读

    探索i.MX 91应用处理家族:为边缘应用带来新可能

    探索i.MX 91应用处理家族:为边缘应用带来新可能 在当今的物联网和工业应用领域,对高性能、安全且节能的处理需求日益增长。NXP的i.MX
    的头像 发表于 12-24 11:50 1263次阅读

    探索i.MX RT1180:高性能处理的技术剖析与应用指南

    探索i.MX RT1180:高性能处理的技术剖析与应用指南 在当今科技飞速发展的时代,高性能处理
    的头像 发表于 12-24 10:20 1126次阅读

    FRDM i.MX 9平台选型指南:FRDM i.MX 9系列开发平台解析

    恩智浦的FRDM平台解决方案旨在提供易于获取的开发工具,有效弥合原型制作与量产之间的鸿沟。FRDM板经济高效、易于使用,具备专业级功能,助力从概念到产品上市的全过程加速推进。在FRDM i.MX
    的头像 发表于 12-11 15:15 5.1w次阅读
    FRDM <b class='flag-5'>i.MX</b> 9平台选型指南:FRDM <b class='flag-5'>i.MX</b> 9系列开发平台解析

    i.MX RT1180实现EtherCAT+伺服控制的终极实践

    今天继续为大家介绍i.MX RT1180实现EtherCAT+伺服控制的终极实践:双电机控制与Ethercat资源使用。
    的头像 发表于 11-26 08:19 4456次阅读
    <b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1180<b class='flag-5'>实现</b>EtherCAT+伺服控制的终极实践

    常用硬件加速的方法

    之前总结了一些常用硬件加速方法 1)面积换速度:也就是串转并运算,可以多个模块同时计算; 2)时间换空间:时序收敛下通过频率提高性能,虽然面积可能稍微加大点; 3)流水线操作:流水线以面积换性能,以
    发表于 10-29 06:20

    硬件协同技术分享 - 任务划分 + 自定义指令集

    ),基于CPU的软件计算时间长达10秒以上。这意味着该模块需要通过硬件加速器实现。 我们的设计将硬件加速器挂载到SoC外围总线上,自动
    发表于 10-28 08:03

    恩智浦推出i.MX 952人工智能应用处理

    恩智浦半导体宣布推出i.MX 9系列的新成员——i.MX 952应用处理。该处理专为AI视觉、人机接口(HMI)及座舱感知应用而设计,通过集成eIQ Neutron神经处理单元(N
    的头像 发表于 10-27 09:15 3689次阅读

    恩智浦i.MX RT1180跨界MCU助力下一代伺服控制系统

    今天我们将聚焦一项正在重塑工业自动化边界的技术组合 —— 基于NXP的i.MX RT1180微控制实现EtherCAT通信与高性能伺服控
    的头像 发表于 09-28 14:16 5137次阅读
    恩智浦<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1180跨界MCU助力下一代伺服控制系统

    恩智浦i.MX RT1180跨界处理如何选型

    i.MX RT1180 跨界处理包含众多的型号,以满足客户对不同性能与价格的需求,今天就先给大家说说如何选型。
    的头像 发表于 09-28 14:01 2822次阅读
    恩智浦<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1180跨界处理<b class='flag-5'>器</b>如何选型

    基于恩智浦i.MX RT1180芯片的EtherCAT+伺服电机控制方案

    i.MX RT1180是恩智浦最近推出的一款高性能跨界处理,其中包含了300MHz的Arm Cortex-M33核以及800MHz的Arm Cortex-M7核,集成了多种网络功能如
    的头像 发表于 09-22 16:27 8833次阅读
    基于恩智浦<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1180<b class='flag-5'>芯片</b>的EtherCAT+伺服电机控制方案

    恩智浦MCU方案 单颗i.MX RT1180实现EtherCAT+伺服控制

    介绍基于单颗i.MX RT1180芯片的EtherCAT+伺服电机控制方案-伺服控制板硬件电路资源介绍,即为下图中的Servo Motor Driver Board。
    的头像 发表于 09-11 14:27 15.6w次阅读
    恩智浦MCU方案 单颗<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1180<b class='flag-5'>实现</b>EtherCAT+伺服控制

    基于恩智浦i.MX RT芯片内部RAM运行LVGL工程

    随着越来越多用户选择i.MX RT系列芯片制作产品,产品的需求以及芯片的用法也越来越多。本文将介绍在i.MX
    的头像 发表于 07-01 09:33 2721次阅读
    基于恩智浦<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b><b class='flag-5'>芯片</b>内部RAM运行LVGL工程

    如何实现安卓与恩智浦i.MX RT1170的无线投屏与控制

    Scrcpy是一款免费开源的软件,支持将安卓端屏幕投影到其他设备,并支持被投屏设备对安卓的反向控制。基于ADB工具,安卓端无需安装任何软件,延迟低,稳定性好。现在,安卓也可投屏到恩智浦i.MX
    的头像 发表于 06-26 09:53 2548次阅读
    如何<b class='flag-5'>实现</b>安卓与恩智浦<b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1170的无线投屏与控制

    NXP i.MX RT1060移植TinyUSB:快速扩展大量USB Class示例

    前言   为啥是TinyUSB?给强大的RT配个轻巧的USB栈! USB这个让我们方便快捷的接口,几乎无处不在。在嵌入式世界,尤其是用上了像NXP i.MX RT这样
    的头像 发表于 05-15 09:25 2817次阅读
    NXP <b class='flag-5'>i.MX</b> <b class='flag-5'>RT</b>1060移植TinyUSB:快速扩展大量USB Class示例