1 概述
说明
每一款芯片的启动文件都值得去研究,因为它可是你的程序跑的最初一段路,不可以不知道。通过了解启动文件,我们可以体会到处理器的架构、指令集、中断向量安排等内容,是非常值得玩味的。
STM32作为一款高端 Cortex-M3系列单片机,有必要了解它的启动文件。打好基础,为以后优化程序,写出高质量的代码最准备。
本文以一个实际测试代码--START_TEST为例进行阐述。
整体过程
STM32整个启动过程是指从上电开始,一直到运行到 main函数之间的这段过程,步骤为(以使用微库为例):
①上电后硬件设置SP、PC
②设置系统时钟
③软件设置SP
④加载.data、.bss,并初始化栈区
⑤跳转到C文件的main函数
代码
启动过程涉及的文件不仅包含 startup_stm32f10x_hd.s,还涉及到了MDK自带的连接库文件 entry.o、entry2.o、entry5.o、entry7.o等(从生成的 map文件可以看出来)。关于startup_stm32f10x_hd.s,具体可以看此文:详解STM32启动文件。
2 程序在Flash上的存储结构
在真正讲解启动过程之前,先要讲解程序下载到 Flash上的结构和程序运行时(执行到main函数)时的SRAM数据结构。程序在用户Flash上的结构如下图所示。下图是通过阅读hex文件和在MDK下调试综合提炼出来的。

上图中:
-
MSP初始值由编译器生成,是主堆栈的初始值。
-
初始化数据段是.data
-
未初始化数据段是.bss
.data和.bss是在__main里进行初始化的,对于ARM Compiler,__main主要执行以下函数:
其中__scatterload会对.data和.bss进行初始化。
加载数据段和初始化栈的参数
加载数据段和初始化栈的参数分别有4个,这里只讲解加载数据段的参数,至于初始化栈的参数类似。
-
0x0800033cFlash上的数据段(初始化数据段和未初始化数据段)起始地址0x20000000加载到SRAM上的目的地址0x0000000c数据段的总大小0x080002f4调用函数_scatterload_copy
需要说明的是初始化栈的函数--0x08000304与加载数据段的函数不一样,为_scatterload_zeroinit,它的目的就是将栈空间清零。

3 数据在SRAM上的结构
程序运行时(执行到main函数)时的SRAM数据结构

4 详细过程分析
有了以上的基础,现在详细分析启动过程,相关文章:STM32代码的启动过程。
上电后硬件设置SP、PC
刚上电复位后,硬件会自动根据向量表偏移地址找到向量表,向量表偏移地址的定义如下:

调试现象如下:

看看我们的向量表内容(通过J-Flash打开hex文件)

硬件这时自动从0x0800 0000位置处读取数据赋给栈指针SP,然后自动从0x0800 0004位置处读取数据赋给PC,完成复位,结果为:
-
SP = 0x02000810PC = 0x08000145
设置系统时钟
上一步中令 PC=0x08000145的地址没有对齐,硬件自动对齐到0x08000144,执行 SystemInit函数初始化系统时钟。
软件设置SP
-
LDR R0,=__mainBX R0
执行上两条之类,跳转到__main程序段运行,注意不是main函数,___main的地址是0x0800 0130。
可以看到指令LDR.W sp,[pc,#12],结果SP=0x2000 0810。
加载.data、.bss,并初始化栈区
-
BL.W __scatterload_rt2
进入__scatterload_rt2代码段。
-
__scatterload_rt2:0x080001684C06 LDR r4,[pc,#24] ; @0x080001840x0800016A4D07 LDR r5,[pc,#28] ; @0x080001880x0800016C E006 B 0x0800017C0x0800016E68E0 LDR r0,[r4,#0x0C]0x08000170 F0400301 ORR r3,r0,#0x010x08000174 E8940007 LDM r4,{r0-r2}0x080001784798 BLX r30x0800017A3410 ADDS r4,r4,#0x100x0800017C42AC CMP r4,r50x0800017E D3F6 BCC 0x0800016E0x08000180 F7FFFFDA BL.W _main_init (0x08000138)
这段代码是个循环(BCC0x0800016e),实际运行时候循环了两次。第一次运行的时候,读取“加载数据段的函数(_scatterload_copy)”的地址并跳转到该函数处运行(注意加载已初始化数据段和未初始化数据段用的是同一个函数);第二次运行的时候,读取“初始化栈的函数(_scatterload_zeroinit)”的地址并跳转到该函数处运行。相应的代码如下:
-
0x0800016E68E0 LDR r0,[r4,#0x0C]0x08000170 F0400301 ORR r3,r0,#0x010x080001740x080001784798 BLX r3
当然执行这两个函数的时候,还需要传入参数。至于参数,我们在“加载数据段和初始化栈的参数”环节已经阐述过了。当这两个函数都执行完后,结果就是“数据在SRAM上的结构”所展示的图。最后,也把事实加载和初始化的两个函数代码奉上如下:
-
__scatterload_copy:0x080002F4 E002 B 0x080002FC0x080002F6 C808 LDM r0!,{r3}0x080002F81F12 SUBS r2,r2,#40x080002FA C108 STM r1!,{r3}0x080002FC2A00 CMP r2,#0x000x080002FE D1FA BNE 0x080002F60x080003004770 BX lr__scatterload_null:0x080003024770 BX lr__scatterload_zeroinit:0x080003042000 MOVS r0,#0x000x08000306 E001 B 0x0800030C0x08000308 C101 STM r1!,{r0}0x0800030A1F12 SUBS r2,r2,#40x0800030C2A00 CMP r2,#0x000x0800030E D1FB BNE 0x080003080x080003104770 BX lr
跳转到C文件的main函数
-
_main_init:0x080001384800 LDR r0,[pc,#0] ; @0x0800013C0x0800013A4700 BX r0
5 异常向量与中断向量表
-
; VectorTableMapped to Address0 at ResetAREA RESET, DATA, READONLYEXPORT __VectorsEXPORT __Vectors_EndEXPORT __Vectors_Size__Vectors DCD __initial_sp ; Top of StackDCD Reset_Handler; ResetHandlerDCD NMI_Handler ; NMI HandlerDCD HardFault_Handler; HardFaultHandlerDCD MemManage_Handler; MPU FaultHandlerDCD BusFault_Handler; BusFaultHandlerDCD UsageFault_Handler; UsageFaultHandlerDCD 0; ReservedDCD 0; ReservedDCD 0; ReservedDCD 0; ReservedDCD SVC_Handler ; SVCallHandlerDCD DebugMon_Handler; DebugMonitorHandlerDCD 0; ReservedDCD PendSV_Handler; PendSVHandlerDCD SysTick_Handler; SysTickHandler; ExternalInterruptsDCD WWDG_IRQHandler ; WindowWatchdogDCD PVD_IRQHandler ; PVD through EXTI Line detectDCD TAMPER_IRQHandler ; TamperDCD RTC_IRQHandler ; RTCDCD FLASH_IRQHandler ; FlashDCD RCC_IRQHandler ; RCCDCD EXTI0_IRQHandler ; EXTI Line0DCD EXTI1_IRQHandler ; EXTI Line1DCD EXTI2_IRQHandler ; EXTI Line2DCD EXTI3_IRQHandler ; EXTI Line3DCD EXTI4_IRQHandler ; EXTI Line4DCD DMA1_Channel1_IRQHandler ; DMA1 Channel1DCD DMA1_Channel2_IRQHandler ; DMA1 Channel2DCD DMA1_Channel3_IRQHandler ; DMA1 Channel3DCD DMA1_Channel4_IRQHandler ; DMA1 Channel4DCD DMA1_Channel5_IRQHandler ; DMA1 Channel5DCD DMA1_Channel6_IRQHandler ; DMA1 Channel6DCD DMA1_Channel7_IRQHandler ; DMA1 Channel7DCD ADC1_2_IRQHandler ; ADC1 & ADC2DCD USB_HP_CAN1_TX_IRQHandler ; USB HighPriority or CAN1 TXDCD USB_LP_CAN1_RX0_IRQHandler ; USB LowPriority or CAN1 RX0DCD CAN1_RX1_IRQHandler ; CAN1 RX1DCD CAN1_SCE_IRQHandler ; CAN1 SCEDCD EXTI9_5_IRQHandler ; EXTI Line9..5DCD TIM1_BRK_IRQHandler ; TIM1 BreakDCD TIM1_UP_IRQHandler ; TIM1 UpdateDCD TIM1_TRG_COM_IRQHandler ; TIM1 Trigger and CommutationDCD TIM1_CC_IRQHandler ; TIM1 CaptureCompareDCD TIM2_IRQHandler ; TIM2DCD TIM3_IRQHandler ; TIM3DCD TIM4_IRQHandler ; TIM4DCD I2C1_EV_IRQHandler ; I2C1 EventDCD I2C1_ER_IRQHandler ; I2C1 ErrorDCD I2C2_EV_IRQHandler ; I2C2 EventDCD I2C2_ER_IRQHandler ; I2C2 ErrorDCD SPI1_IRQHandler ; SPI1DCD SPI2_IRQHandler ; SPI2DCD USART1_IRQHandler ; USART1DCD USART2_IRQHandler ; USART2DCD USART3_IRQHandler ; USART3DCD EXTI15_10_IRQHandler ; EXTI Line15..10DCD RTCAlarm_IRQHandler; RTC Alarm through EXTI LineDCD USBWakeUp_IRQHandler; USB Wakeup from suspendDCD TIM8_BRK_IRQHandler ; TIM8 BreakDCD TIM8_UP_IRQHandler ; TIM8 UpdateDCD TIM8_TRG_COM_IRQHandler ; TIM8 Trigger and CommutationDCD TIM8_CC_IRQHandler ; TIM8 CaptureCompareDCD ADC3_IRQHandler ; ADC3DCD FSMC_IRQHandler ; FSMCDCD SDIO_IRQHandler ; SDIODCD TIM5_IRQHandler ; TIM5DCD SPI3_IRQHandler ; SPI3DCD UART4_IRQHandler ; UART4DCD UART5_IRQHandler ; UART5DCD TIM6_IRQHandler ; TIM6DCD TIM7_IRQHandler ; TIM7DCD DMA2_Channel1_IRQHandler ; DMA2 Channel1DCD DMA2_Channel2_IRQHandler ; DMA2 Channel2DCD DMA2_Channel3_IRQHandler ; DMA2 Channel3DCD DMA2_Channel4_5_IRQHandler ; DMA2 Channel4& Channel5__Vectors_End
这段代码就是定义异常向量表,在之前有一个“J-Flash打开hex文件”的图片跟这个表格是一一对应的。编译器根据我们定义的函数 Reset_Handler、NMI_Handler等,在连接程序阶段将这个向量表填入这些函数的地址。
startup_stm32f10x_hd.s内容:
-
NMI_Handler PROCEXPORT NMI_Handler [WEAK]B .ENDP
stm32f10x_it.c中内容:
voidNMI_Handler(void){}
在启动汇编文件中已经定义了函数 NMI_Handler,但是使用了“弱”,它允许我们再重新定义一个 NMI_Handler函数,程序在编译的时候会将汇编文件中的弱函数“覆盖掉”--两个函数的代码在连接后都存在,只是在中断向量表中的地址填入的是我们重新定义函数的地址。
6 使用微库与不使用微库的区别

使用微库就意味着我们不想使用MDK提供的库函数,而想用自己定义的库函数,比如说printf函数。那么这一点是怎样实现的呢?我们以printf函数为例进行说明。
不使用微库而使用系统库
在连接程序时,肯定会把系统中包含printf函数的库拿来调用参与连接,即代码段有系统库的参与。
在启动过程中,不使用微库而使用系统库在初始化栈的时候,还需要初始化堆(猜测系统库需要用到堆),而使用微库则是不需要的。
-
IF __MICROLIBEXPORT __initial_spEXPORT __heap_baseEXPORT __heap_limitELSEIMPORT __use_two_region_memoryEXPORT __user_initial_stackheap__user_initial_stackheapLDR R0, = Heap_MemLDR R1, =(Stack_Mem+ Stack_Size)LDR R2, = (Heap_Mem+ Heap_Size)LDR R3, = Stack_MemBX LRALIGNENDIF
另外,在执行__main函数的过程中,不仅需要完成“使用微库”情况下的所有工作,额外的工作还需要进行库的初始化,才能使用系统库(这一部分我还没有深入探讨)。附上__main函数的内容:
-
__main:0x08000130 F000F802 BL.W __scatterload_rt2_thumb_only (0x08000138)0x08000134 F000F83C BL.W __rt_entry_sh (0x080001B0)__scatterload_rt2_thumb_only:0x08000138 A00A ADR r0,{pc}+4; @0x080001640x0800013A E8900C00 LDM r0,{r10-r11}0x0800013E4482 ADD r10,r10,r00x080001404483 ADD r11,r11,r00x08000142 F1AA0701 SUB r7,r10,#0x01__scatterload_null:0x0800014645DA CMP r10,r110x08000148 D101 BNE 0x0800014E0x0800014A F000F831 BL.W __rt_entry_sh (0x080001B0)0x0800014E F2AF0E09 ADR.W lr,{pc}-0x07; @0x080001470x08000152 E8BA000F LDM r10!,{r0-r3}0x08000156 F0130F01 TST r3,#0x010x0800015A BF18 IT NE0x0800015C1AFB SUBNE r3,r7,r30x0800015E F0430301 ORR r3,r3,#0x010x080001624718 BX r30x080001640298 LSLS r0,r3,#100x080001660000 MOVS r0,r00x0800016802B8 LSLS r0,r7,#100x0800016A0000 MOVS r0,r0__scatterload_copy:0x0800016C3A10 SUBS r2,r2,#0x100x0800016E BF24 ITT CS0x08000170 C878 LDMCS r0!,{r3-r6}0x08000172 C178 STMCS r1!,{r3-r6}0x08000174 D8FA BHI __scatterload_copy (0x0800016C)0x080001760752 LSLS r2,r2,#290x08000178 BF24 ITT CS0x0800017A C830 LDMCS r0!,{r4-r5}0x0800017C C130 STMCS r1!,{r4-r5}0x0800017E BF44 ITT MI0x080001806804 LDRMI r4,[r0,#0x00]0x08000182600C STRMI r4,[r1,#0x00]0x080001844770 BX lr0x080001860000 MOVS r0,r0__scatterload_zeroinit:0x080001882300 MOVS r3,#0x000x0800018A2400 MOVS r4,#0x000x0800018C2500 MOVS r5,#0x000x0800018E2600 MOVS r6,#0x000x080001903A10 SUBS r2,r2,#0x100x08000192 BF28 IT CS0x08000194 C178 STMCS r1!,{r3-r6}0x08000196 D8FB BHI 0x080001900x080001980752 LSLS r2,r2,#290x0800019A BF28 IT CS0x0800019C C130 STMCS r1!,{r4-r5}0x0800019E BF48 IT MI0x080001A0600B STRMI r3,[r1,#0x00]0x080001A24770 BX lr__rt_lib_init:0x080001A4 B51F PUSH {r0-r4,lr}0x080001A6 F3AF8000 NOP.W__rt_lib_init_user_alloc_1:0x080001AA BD1F POP {r0-r4,pc}__rt_lib_shutdown:0x080001AC B510 PUSH {r4,lr}__rt_lib_shutdown_user_alloc_1:0x080001AE BD10 POP {r4,pc}__rt_entry_sh:0x080001B0 F000F82F BL.W __user_setup_stackheap (0x08000212)0x080001B44611 MOV r1,r2__rt_entry_postsh_1:0x080001B6 F7FFFFF5 BL.W __rt_lib_init (0x080001A4)__rt_entry_postli_1:0x080001BA F000F919 BL.W main (0x080003F0)
使用微库而不使用系统库
在程序连接时,不会把包含printf函数的库连接到终极目标文件中,而使用我们定义的库。
启动时需要完成的工作就是之前论述的步骤1、2、3、4、5,相比使用系统库,启动过程步骤更少。
-
STM32
+关注
关注
2307文章
11128浏览量
371394 -
函数
+关注
关注
3文章
4408浏览量
66916 -
Start
+关注
关注
0文章
73浏览量
12577
原文标题:了解STM32启动过程,好优化程序
文章出处:【微信号:c-stm32,微信公众号:STM32嵌入式开发】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
在verilog testbench中运行测试用例时,运行到make run_test出错怎么解决?
Iverilog仿真e203_hbirdv2跑RISC-V指令测试用例
Linux环境下div指令、divu指令测试异常怎么解决?
【RA4M2-SENSOR】+Memory读写测试及观察
为什么 ESD 测试能过,但实际应用还是被击坏?
上海控安:基于模型的测试用例生成
HarmonyOSAI编程单元测试用例
HarmonyOS AI辅助编程工具(CodeGenie)代码测试
如何综合性测试一款电源芯片?——以ASP3605芯片为例
Display下面测试Test模式出错的原因?
ADS1146的外接时钟,以4.096MHZ为例,这个时钟频率是用来决定采样频率的么?
通用自动化测试软件 - TAE

实际测试代码--START_TEST为例进行阐述

评论