0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何正确使用MDK-ARM优化功能, 以及优化之后带来的影响

黄工的嵌入式技术圈 来源:黄工的嵌入式技术圈 作者:黄工的嵌入式技术 2020-02-28 15:17 次阅读

许多朋友使用MDK-ARM很长时间,却不知它的优化选项到底该有什么用,或者说到底该如何使用。 本文围绕MDK-ARM优化选项,以及相关拓展知识(微库、实际应用、调试)进行讲述,希望对你今后开发项目有所帮助。

1总述

我们所指的优化,主要两方面:

代码大小(Size)

代码性能(运行时间)

在MDK-ARM中,优化相关的配置选项:

当然,如果选择编译器(AC5、AC6)不同,优化选项也有差异(下面讲述)。 举例:某些项目MCU容量有限时,你除了修改代码(优化开支),同时你有必要使用优化选项。 某些项目(比如某算法)需要高效(最短时间)运行,此时有必要使用优化选项。

2优化选项说明

本节详细讲述优化相关选项,同时,编译器选择AC5和AC6时有差异,下面也会针对AC5和6分别讲述。

1.Use Cross-Module Optimization:使用跨模块优化使用跨模块优化可以启用链接器反馈文件(进行两次编译),从而允许进一步的代码优化。

提示:A.不针对库目标执行跨模块优化。 B.跨模块优化将增加构建项目所需的时间,因为会自动执行多个编译和链接步骤。 2.Use MicroLIB:使用微库它是ISO标准C运行时库的子集(其中一部分),提供了性能和代码大小之间的权衡。 微库并不完全兼容ANSI,但对于大多数小型嵌入式应用程序来说已经足够了。 3.Use Link-Time Code Generation:使用链接时代码生成(优化)在V5版本之前有这个优化选项,多文件编译,链接时进行优化:

函数跨模块内联

删除未引用的变量和函数

通过重新排列变量优化内存访问

在可能的情况下重用内存


4.Execute-only Code:生成只执行的代码不包含未使用(函数、变量等)代码段。 仅限于:

C、Thumb代码

基于Cortex-M3、M4的处理器

编译器5.04以上

5.Optimize for Time:优化时间以更大的代码大小为代价,减少执行时间。比如:使用内联函数。 编译器为AC6时,此选项为【Link-Time Optimization】,在链接状态下执行模块间优化。 6.Split Load and Store Multiple:分割加载和多存储指示编译器将LDM和STM指令拆分为两个或多个LDM或STM指令,以减少延迟,此选项可以提高系统的总体性能。 7.The One ELF Section per Function:每个函数一个ELF段ELF代码段通常包含许多函数的代码,此选项告诉编译器将所有函数放入它们自己的ELF段,这允许链接器删除未使用的ELF段(而不是未使用的函数)。

8.AC5时:Optimization优化选项:默认值,以优化性能为主。 Level 0 (-O0):关闭大部分优化,除了一些简单的转换,生成的代码具有最佳的调试视图。 Level 1 (-O1):应用受限优化。 比如:删除未使用的内联函数和静态函数,删除冗余代码和重新排序指令等。生成的代码经过合理优化,具有良好的调试视图。 Level 2 (-O2):高度优化,目标代码到源代码的映射并不一定对应,因此,不利于调试。 Level 3 (-O3):最大级别优化,级别3与时间优化相结合可能生成比级别2更多的代码。 9.AC6时:Optimization优化选项当编译器选择AC6时,优化选项有差异(有更多优化选项):

AC6优化选型中前面5项(default、-O0 ~ 3)和AC5的作用基本一样,但AC6多了三个选项。 -Ofast:启用-O3的所有优化,以及其他可能违反语言标准(严格遵守)的优化。 -Os balanced:平衡代码大小与代码速度。默认情况下,编译器执行优化以提高性能,但可能会增加image文件大小。 -Oz image size:优化代码大小。

3如何优化?

本节讲述三种编译优化,使其达到最优(代码最小、性能最好)

代码大小

代码性能(速度)

代码平衡(大小和速度)

1.优化代码大小针对AC5编译器:

Use MicroLIB

Use Cross-module optimization

Optimization:level 2 (-O2)

针对AC6编译器:

Use MicroLIB

Optimization:-Oz image size

说明:A.代码量大(ELF代码段通常包含许多函数的代码),可考虑使用The One ELF Section per Function选项减小代码。 B.AC6编译器改进了优化功能(可以理解为增加的3个选项集成了优化功能)。 代码优化大小(对比):

2.优化代码性能针对AC5编译器:

Use Cross-module optimization

Optimization:level 3 (-O3)

Optimize for Time

针对AC6编译器:

Optimization:-Ofast

Link-Time Optimization

代码优化性能(对比):

3.代码平衡这种情况下,在满足代码大小的同时,我们应尽量满足性能。 这里其实就是一个相关平衡的关系,结合上面两种优化方式根据自己实际情况出发,一般优化考虑如下配置。 针对AC5编译器:

Use Cross-module optimization

Optimization:level 3 (-O3)

Optimize for Time

针对AC6编译器:

Optimization:-Os balanced

Link-Time Optimization

当然,AC6中-Os balanced优化选项更智能

4拓展说明

MDK-ARM的优化功能需要结合项目实际情况进行优化。对一些项目能起到很大帮助作用,但优化之后也可能带来一些影响。

1.使用高度优化(-O1以上),可能会影响Debug调试(因为优化之后,编译输出和实际代码不匹配)。

2.指定源文件/文件组优化

有些代码不需要优化,我们优化指定的源文件/文件组就行。

推荐阅读:Keil系列教程

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8651

    浏览量

    361782
  • 代码
    +关注

    关注

    30

    文章

    4555

    浏览量

    66770
  • MDK
    MDK
    +关注

    关注

    4

    文章

    208

    浏览量

    31770
收藏 人收藏

    评论

    相关推荐

    如何在Keil MDK-ARM环境下开发STM32L011K4T6?

    在Keil MDK-ARM环境下开发STM32L011K4T6
    发表于 04-22 06:49

    Keil MDK优化选项说明

    最近,看到群里的小伙伴在讨论【我的代码不按照流程执行】相关的话题。这类问题,有经验的工程师肯定能想到是什么原因导致的,那就是编译器把你代码优化了。
    的头像 发表于 11-20 10:21 2133次阅读
    Keil <b class='flag-5'>MDK</b><b class='flag-5'>优化</b>选项说明

    MDK中的不同优化等级有什么区别?

    什么时候该使用什么优化等级
    发表于 11-01 07:50

    MDK中怎么设置不同的优化等级大小?

    MDK中怎么设置不同的优化等级大小
    发表于 10-12 08:08

    MDK编译代码为什么不能使用最高的优化等级?

    MDK编译代码为什么不能使用最高的优化等级
    发表于 10-09 09:08

    螺母生产流程以及优化措施

    螺母生产流程以及优化措施
    的头像 发表于 09-07 17:56 621次阅读
    螺母生产流程<b class='flag-5'>以及</b><b class='flag-5'>优化</b>措施

    ARM Cortex-A510核心软件优化指南

    核心的主要功能包括: ·ARM®v9.0-A A64指令集的实施·所有异常级别的AArch64执行状态,EL0至EL3·使用内存管理单元(MMU)分离L1数据和指令端内存系统·具有直接和间接分支预测
    发表于 08-28 08:15

    ARM编译器优化版本1.0

    ARM编译器armcc可以优化您的代码以实现小代码和高性能。 本教程介绍了编译器执行的主要优化技术,并解释了如何控制编译器优化。 本教程假定您已经安装并许可了
    发表于 08-28 07:11

    移植和优化用于Arm文档的HPC应用程序

    介绍如何将高性能计算(HPC)应用程序移植到基于ARM的硬件上,如何在移植后开始优化应用程序,以及ARM提供了哪些工具来帮助
    发表于 08-25 07:58

    针对1.0版移动设备上的图形内容的优化建议

    这些主题提供了有关如何通过避免可能导致应用程序运行缓慢或设备过热的常见图形问题来优化Android应用程序的建议。 ARM Mobile Studio可以帮助您识别性能瓶颈,并确定您的应用程序受
    发表于 08-24 06:57

    Arm Neoverse N1软件优化指南

    本文档提供了有关Neoverse N1管道、指令性能特征和特殊性能注意事项的高级信息。此信息旨在帮助优化Neoverse N1软件和编译器的人员。有关Neoverse N1处理器的更完整描述,请参阅Arm®Neoverse™ N1技术参考手册。
    发表于 08-11 06:56

    针对ARM SVE 4.0版移植和优化HPC应用程序文档

    介绍如何将高性能计算(HPC)应用程序移植到基于SVE的Arm硬件,如何在移植后开始优化应用程序,以及Arm提供了哪些工具可以提供帮助。
    发表于 08-10 07:11

    ARM 3.0版移植和优化HPC应用程序文档

    描述如何将高性能计算(HPC)应用程序移植到基于Arm的硬件,如何在移植后开始优化应用程序,以及Arm提供了哪些工具可以提供帮助
    发表于 08-10 06:37

    Keil μVision 5中,如何操作ARM编译程序提供的程序优化功能

    Keil μVision 5中,如何操作ARM 编译程序提供的程序优化功能功能介绍: 使用程序优化
    发表于 06-20 06:25

    全志Tina Linux 启动优化

    --> app brom 固化在 IC 内部,芯片出厂后就无法更改。 后续将从 boot0 开始分阶段介绍启动优化的方法。 BOOT0 启动优化 boot0 运行在SRAM ,主要功能
    发表于 05-24 10:32