0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

riscv64裸机编程实践与分析

嵌入式IoT 来源:嵌入式IoT 作者:嵌入式IoT 2020-12-31 10:54 次阅读

riscv64 裸机编程实践与分析

  • 1.概述

  • 2.最小工程的构成

  • 3. 链接脚本

  • 4.可执行的程序源代码分析

  • 5.编译与运行

    • 5.1 编译

    • 5.2 运行

    • 5.3 调试

  • 6.总结

1.概述

任何芯片在启动之前都需要有一段汇编代码,从这段汇编代码上就可以体现一些架构设计的特点。往往做嵌入式底层开发都需要关注这段汇编代码的含义,这样在使用的时候才能全面的了解启动时做了什么事情,在后续的程序中遇到问题也能复盘推演。

本文就针对riscv64的最开始的启动部分代码进行分析,从最小的一个裸机代码开始分析,彻底的弄清楚riscv启动的流程。

本次使用的环境是riscv64 qemu,而编译器是通过下面的地址进行下载

https://www.sifive.com/software

2.最小工程的构成

一个最小的工程包含两个东西:链接脚本以及源代码。

源代码就是可以让cpu执行的代码,通过交叉编译工具链编译生成可执行的二进制程序。

链接脚本文件则可以告诉程序的布局,比如代码段,函数的入口等等。有了这两个文件将编译出来的程序loader到板子上运行即可。

3. 链接脚本

下面看一下hello.ld文件。

OUTPUT_ARCH("riscv")
OUTPUT_FORMAT("elf64-littleriscv")
ENTRY(_start)
SECTIONS
{
/*text:testcodesection*/
.=0x80000000;
.text:{*(.text)}
/*data:Initializeddatasegment*/
.gnu_build_id:{*(.note.gnu.build-id)}
.data:{*(.data)}
.rodata:{*(.rodata)}
.sdata:{*(.sdata)}
.debug:{*(.debug)}
.+=0x8000;
stack_top=.;

/*Endofuninitalizeddatasegement*/
_end=.;
}

对于链接脚本(linker script),往往都是规定如何把输入的文件按照特定的地址放到内存中。

其中就上面的脚本而言:

OUTPUT_ARCH("riscv"):表示输入文件的架构是riscv。

OUTPUT_FORMAT("elf64-littleriscv"):表示elf64小端。一般arm,riscv,x86都是小端,小端是比较主流的。

ENTRY( _start ):表示函数入口是_start

然后开始进行代码段的布局,起始地址开始处为0x80000000。然后依次放代码段、数据段、只读数据段、全局数据段,debug段等等。

这里需要注意:

.+=0x8000;
stack_top=.;

这里说明,栈顶预留了0x8000个字节空间作为程序的栈空间,因为栈是向上增长的,所以这里预留了一些栈空间。

通过反汇编来查看生成程序的布局情况

#riscv64-unknown-elf-objdump-dhello

hello:fileformatelf64-littleriscv


Disassemblyofsection.text:

0000000080000000<_start>:
80000000:f14022f3csrrt0,mhartid
80000004:00029c63bnezt0,8000001c
80000008:00008117auipcsp,0x8
8000000c:04410113addisp,sp,68#8000804c<_end>
80000010:00000517auipca0,0x0
80000014:03450513addia0,a0,52#80000044
80000018:008000efjalra,80000020

000000008000001c:
8000001c:0000006fj8000001c

0000000080000020:
80000020:100102b7luit0,0x10010
80000024:00054303lbut1,0(a0)
80000028:00030c63beqzt1,80000040
8000002c:0002a383lwt2,0(t0)#10010000
80000030:fe03cee3bltzt2,8000002c
80000034:0062a023swt1,0(t0)
80000038:00150513addia0,a0,1
8000003c:fe9ff06fj80000024
80000040:00008067ret

对于qemu来说,sifive_u的起始地址为0x80000000,将代码段的入口放在此处。

4.可执行的程序源代码分析

前面已经描述了链接脚本的布局,也就是给程序指定了执行的地址,每个函数以及函数入口在什么地址都已经规划好了,那么具体的入口函数该如何写呢?

看看hello.s编程代码:

.align 2
.equ UART_BASE,         0x10010000
.equ UART_REG_TXFIFO,   0

.section .text
.globl _start

_start:
        csrr  t0, mhartid             # read hardware thread id (`hart` stands for `hardware thread`)
        bnez  t0, halt                   # run only on the first hardware thread (hartid == 0), halt all the other threads

        la    sp, stack_top           # setup stack pointer

        la    a0, msg                 # load address of `msg` to a0 argument register
        jal   puts                    # jump to `puts` subroutine, return address is stored in ra regster

halt:   j     halt                    # enter the infinite loop

puts:                                 # `puts` subroutine writes null-terminated string to UART (serial communication port)
                                      # input: a0 register specifies the starting address of a null-terminated string
                                      # clobbers: t0, t1, t2 temporary registers

        li    t0, UART_BASE           # t0 = UART_BASE
1:      lbu   t1, (a0)                # t1 = load unsigned byte from memory address specified by a0 register
        beqz  t1, 3f                  # break the loop, if loaded byte was null

                                      # wait until UART is ready
2:      lw    t2, UART_REG_TXFIFO(t0) # t2 = uart[UART_REG_TXFIFO]
        bltz  t2, 2b                  # t2 becomes positive once UART is ready for transmission
        sw    t1, UART_REG_TXFIFO(t0) # send byte, uart[UART_REG_TXFIFO] = t1

        addi  a0, a0, 1               # increment a0 address by 1 byte
        j     1b

3:      ret

.section .rodata
msg:
     .string "Hello.
"

根据汇编语言的规则

.align2

表示入口程序以2^2也就是4字节对齐。

.equUART_BASE,0x10010000
.equUART_REG_TXFIFO,0

定义了UART的寄存器的基地址。

接着主要从_start:开始分析。

csrrt0,mhartid#readhardwarethreadid(`hart`standsfor`hardwarethread`)
bnezt0,halt#runonlyonthefirsthardwarethread(hartid==0),haltalltheotherthreads

根据riscv的设计,如果一个部件包含一个独立的取指单元,那么该部件被称为核心(core)。

一个RiscV兼容的核心能够通过多线程技术(或者说超线程技术)支持多个RiscV兼容硬件线程(harts),harts这儿就是指硬件线程, hardware thread的意思。

ba4f8054-4ad0-11eb-8b86-12bb97331649.png


上面的就包含一个E51的核和4个U54的核。

而这段汇编就是将其他的核挂起,只运行hartid == 0的核。

紧接着

lasp,stack_top#setupstackpointer

这里将栈指针sp赋值,sp此时指向栈顶。

laa0,msg#loadaddressof`msg`toa0argumentregister
jalputs#jumpto`puts`subroutine,returnaddressisstoredinraregster

对于riscv 架构来说,a0寄存器表示第一个参数赋值,接着跳转到puts函数中。

此时传递过去的参数为a0,也就是

.section.rodata
msg:
.string"Hello.
"

指向一个只读的字符串结构的数据。

puts的实现

通过汇编来描述一个串口驱动程序的编写是比较重要的。

puts:#`puts`subroutinewritesnull-terminatedstringtoUART(serialcommunicationport)
#input:a0registerspecifiesthestartingaddressofanull-terminatedstring
#clobbers:t0,t1,t2temporaryregisters

lit0,UART_BASE#t0=UART_BASE
1:lbut1,(a0)#t1=loadunsignedbytefrommemoryaddressspecifiedbya0register
beqzt1,3f#breaktheloop,ifloadedbytewasnull

#waituntilUARTisready
2:lwt2,UART_REG_TXFIFO(t0)#t2=uart[UART_REG_TXFIFO]
bltzt2,2b#t2becomespositiveonceUARTisreadyfortransmission
swt1,UART_REG_TXFIFO(t0)#sendbyte,uart[UART_REG_TXFIFO]=t1

addia0,a0,1#incrementa0addressby1byte
j1b

3:ret

首先刚才通过a0寄存器将参数传递过来,然后从1:开始,读取字符串,beqz t1, 3f表示当t1 == 0时,跳转到3:之前。此时会跳出2:循环。

2:则是向串口FIFO送数的过程。

到这里一个字符串输出就可以正常的执行了。

5.编译与运行

5.1 编译

上述程序分析完成会,可以将其进行编译。

riscv64-unknown-elf-gcc-march=rv64g-mabi=lp64-static-mcmodel=medany-fvisibility=hidden-nostdlib-nostartfiles-Thello.ld-Isifive_uhello.s-ohello

上述编译过程可以生成hello程序。

#readelf-hhello
ELFHeader:
Magic:7f454c46020101000000000000000000
Class:ELF64
Data:2'scomplement,littleendian
Version:1(current)
OS/ABI:UNIX-SystemV
ABIVersion:0
Type:EXEC(Executablefile)
Machine:RISC-V
Version:0x1
Entrypointaddress:0x80000000
Startofprogramheaders:64(bytesintofile)
Startofsectionheaders:4680(bytesintofile)
Flags:0x0
Sizeofthisheader:64(bytes)
Sizeofprogramheaders:56(bytes)
Numberofprogramheaders:1
Sizeofsectionheaders:64(bytes)
Numberofsectionheaders:7
Sectionheaderstringtableindex:6

可以分析一下gcc携带的参数。

-march:可以指定编译出来的架构,比如rv32或者rv64等等。

-static:表示静态编译。

-mabi=lp64:数据模型和浮点参数传递规则

数据模型:

- int字长 long字长 指针字长
ilp32/ilp32f/ilp32d 32bits 32bits 32bits
lp64/lp64f/lp64d 32bits 64bits 64bits

浮点传递规则

- 需要浮点扩展指令? float参数 double参数
ilp32/lp64 不需要 通过整数寄存器(a0-a1)传递 通过整数寄存器(a0-a3)传递
ilp32f/lp64f 需要F扩展 通过浮点寄存器(fa0-fa1)传递 通过整数寄存器(a0-a3)传递
ilp32d/lp64d 需要F扩展和D扩展 通过浮点寄存器(fa0-fa1)传递 通过浮点寄存器(fa0-fa1)传递

-mcmodel=medany:对于-mcmodel=medlow-mcmodel=medany

-mcmodel=medlow

使用 LUI 指令取符号地址的高20位。LUI 配合其它包含低12位立即数的指令后,可以访问的地址空间是 -2GiB ~ 2GiB。

对于 RV64 而言,能访问的就是 0x0000000000000000 ~ 0x000000007FFFFFFF,以及 0xFFFFFFFF800000000 ~ 0xFFFFFFFFFFFFFFFF 这两个区域,前一个区域即 +2GiB 的地址空间,后一个区域即 -2GiB 的地址空间。其它地址空间就访问不到了。

-mcmodel=medany

使用 AUIPC 指令取符号地址的高20位。AUIPC 配合其它包含低12位立即数的指令后,可以访问当前 PC 的前后2GiB (PC - 2GiB ~ PC + 2GiB)的地址空间。

对于RV64,取决于当前 PC 值,能访问到是 PC - 2GiB 到 PC + 2GiB 这个地址空间。假设当前 PC 是 0x1000000000000000,那么能访问的地址范围是 0x0000000080000000 ~ 0x100000007FFFFFFF。假设当前 PC 是 0xA000000000000000,那么能访问的地址范围是0x9000000080000000~0xA00000007FFFFFFF。

-fvisibility=hidden:动态库部分需要对外显示的函数接口显示出来。

-nostdlib:不连接系统标准启动文件和标准库文件,只把指定的文件传递给连接器

-nostartfiles:不带main函数的入口程序。

-Thello.ld:加载链接地址。

5.2 运行

输入下面的命令即可看到Hello.字符串输出。

#qemu-system-riscv64-nographic-machinesifive_u-biosnone-kernelhello
Hello.

5.3 调试

调试过程比较只需在运行的后面加-s -S,即

qemu-system-riscv64-nographic-machinesifive_u-biosnone-kernelhello-s-S

另外再开一个终端输入

riscv64-unknown-elf-gdbhello

接着输入target remote localhost:1234即可。

通过b _start打断点,并且通过si进行单步跳转可实现程序的单步运行。

6.总结

riscv64最小裸机程序的运行很好理解,主要梳理清楚其启动地址与链接文件即可。还有就是注意gcc的编译参数,这些对于riscv的启动来说也是非常关键的部分。

责任编辑:xj

原文标题:riscv64 裸机编程实践与分析

文章出处:【微信公众号:嵌入式IoT】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程
    +关注

    关注

    88

    文章

    3439

    浏览量

    92368
  • RISC
    +关注

    关注

    6

    文章

    430

    浏览量

    83218

原文标题:riscv64 裸机编程实践与分析

文章出处:【微信号:Embeded_IoT,微信公众号:嵌入式IoT】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    全志D1s开发板裸机开发之坏境搭建

    环境搭建 开发板介绍 张天飞老师编写的《RISC-V体系结构编程实践》,里面的源码是基于 QEMU 模拟器的,可以认为它是一款虚拟的开发板。如果需要在真实开发板上学习,可以使用百问网
    发表于 03-06 13:54

    Linux裸机点灯

    Linux裸机
    怎么啦
    发布于 :2023年10月27日 08:47:24

    RT-Smart riscv64汇编注释

    以rt-smart在全志D1上的代码为例,主要注释了rt-smart在riscv64上的系统初始化和异常处理的代码
    的头像 发表于 10-12 17:26 337次阅读
    RT-Smart <b class='flag-5'>riscv64</b>汇编注释

    Debian12桌面异常卡是为什么?

    riscv64 202306 镜像,然后upgrade了系统。 不是版本2带GPU了吗,是没有适配GPU吗,桌面基本跑不动,点一下鼠标要四五秒才有反应,版本1没有GPU的体验还好点勉强能用,版本2完全不可用。
    发表于 09-12 07:05

    【昉·星光 2 高性能RISC-V单板计算机体验】四:在 VisionFive2 上安装 ROS2 humble

    的依赖 dnf install -y \\\\ http://123.60.74.95:3389/openEuler:/22.03:/Epol/22.03/riscv64
    发表于 09-04 03:33

    【昉·星光 2 高性能RISC-V单板计算机体验】三:基于RISC-V交叉编译工具链的OpenCV库编译

    \\\\_depend –share 修改Makefile: CC=riscv64\\\\-unknown\\\\-linux\\\\-gnu\\\\-gcc AR=riscv64\\\\-unknown
    发表于 09-02 22:10

    【昉·星光 2 高性能RISC-V单板计算机体验】利用VF2部署一个网络摄像头

    Linux starfive 5.15.0-starfive #1 SMP Sun Jun 11 07:48:39 UTC 2023 riscv64 GNU/Linux 就是因为文件名上带
    发表于 08-22 00:28

    d1哪吒开发板的启动流程分析

    志D1芯片的启动流程最底层的分析来看,和其他全志产品线的芯片的启动流程基本类似,主要需要理解的是fel模式下对SRAM,DDR等操作,这样在做裸机开发的时候,才能将程序下载进去。有了这些理解,在做riscv的底层
    发表于 08-16 08:16

    riscv实现自定义指令并用qemu运行的过程

    qemu模拟硬件平台,实现特定指令解析,同时写裸机代码来测试该指令的运行情况。当然,如果实现的很好,是需要修改riscv的gcc的,让自己的扩展指令加入。这里不做修改,后面会详细描述细节。 自定义指令
    发表于 08-16 07:27

    全志D1开发板RISCV64开箱评测

    的生态建设远远没有arm强大,但是也在开源思想的引领下,开始逐步走向大众的视野。 这块哪吒 RISCV64的板子,从主要的核的特性上来看,与目前市面上可见的riscv开发板相比,特性主要有以下几点: 1.
    发表于 08-16 07:05

    嵌入式编程中为什么使用qemu?qemu的实际应用

    aarch64编程,采用qemu,运行自己写的裸机代码,能够非常方便的进行各种实验。 在进行rtos的开发过程中,经常会采用qemu作为调试工具,进行龙芯、树莓派、riscv相关的开发
    发表于 08-16 06:44

    RISCV的生态里有没有可以离线分析MCU运行异常的工具?

    大家好, 请教一下大家在RISCV的生态里有没有可以离线(不接开发板)分析MCU运行异常的工具; 具体的流程: MCU运行过程发生异常,主动上报Assert,程序将异常位置的上下文寄存器存储到RAM
    发表于 08-12 07:33

    RISC-V64 正式成为Debian官方支持架构

    RISC-V64 正式成为Debian官方支持架构 RISC-V生态越加丰富,发展态势良好,日前,Debian社区已经正式接受riscv64作为官方支持架构,Debian官方支持是一个重要里程碑
    发表于 07-31 18:03 617次阅读

    STM32裸机编程的基础知识(1)

    这个系列将介绍 STM32 裸机编程的基础知识,以便更好地理解 STM32Cube、Keil 等框架和 IDE 是如何工作的。本指南完全从头开始,只需要编译器和芯片数据手册,而不依赖任何其它软件工具和框架。
    发表于 06-28 15:14 371次阅读
    STM32<b class='flag-5'>裸机</b><b class='flag-5'>编程</b>的基础知识(1)

    RT-Thread BSP qemu-virt64-riscv的编译环境搭建

    -pc-linux-gnu_latest.tar.bz2’,   ‘Windows’ : ‘aarch64-linux-musleabi_for_i686-w64-mingw32_latest.zip’   },   ‘riscv64
    发表于 05-16 10:37