0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

毕昇Fortran编译器内联动态库函数str_copy

openEuler 来源:openEuler 作者:openEuler 2022-09-21 11:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

项目简介

项目名称

毕昇Fortran编译器内联动态库函数str_copy

项目描述

毕昇Fortran编译器是一款基于classic flang的高性能Fortran编译器,支持Fortran编程语言的编译和运行,提供强大的数值计算和数据处理能力,在科学计算领域应用前景广阔。f90_str_copy_klen是一个实现字符串拷贝功能的动态库函数,本项目是对该动态库函数进行内联,预期提高编译器字符串拷贝的性能。

项目导师

peixin-qiao

项目开发者

王哲葳,华东师范大学硕士在读

项目链接

https://summer-ospp.ac.cn/#/org/prodetail/22b970386

开发详情

方案描述

Flang编译器主要由flang1和flang2两个组件组成,其中flang1用于解析Fortran代码并生成中间表示,然后通过flang2生成LLVM IR并输出。本项目的主要任务就是在flang2中对解析出的“f90_str_copy_klen”函数进行内联优化。这个项目的方案分为如下几步:

01

flang2会获得通过Fortran生成的IR指令列表,遍历该列表,寻找到函数调用指令“I_CALL”。

02

通过“I_CALL”指令的位置查询所调用的是否为需要被内联的函数,如本项目需要实现的“f90_str_copy_klen”函数的内联。在确认需要内联的函数后开始生成相应的指令,“f90_str_copy_klen”函数的内联指令生成过程如下:

  1. 将复制后得到的字符串称为目标字符串,待复制的字符串称为输入字符串。首先需要从原先的指令中获得输入字符串并开辟一系列内存空间用于记录目标字符串、输入字符串的起始地址、字符串索引及字符串长度。

  2. 对每一个输入字符串,从头开始遍历。分别判断当前目标字符串、输入字符串的索引是否小于其长度,如果均符合则将输入字符串中对应索引的字符复制到目标字符串的相应地址中。如果输入字符串索引大于等于其长度则处理下一个输入字符串。如果目标字符串索引大于等于其长度则停止字符串的复制。

  3. 按照2所述流程依次遍历函数中的输入字符串,直至所有字符串都完成复制。

  4. 目标字符串索引是否仍小于其长度,若是,则将目标字符串中剩余未被赋值的字符用空格进行补充。

  5. 将实现上述功能的指令替换掉对应的“I_CALL”指令。

03

继续flang2中的流程以生成对应的LLVM IR 文件。

项目产出

实现了项目方案中所需的功能。

分别用一个字符串、三个字符串作为输入字符串,完成了共十种输入字符串各种长度情况下”f90_str_copy_klen”函数内联的的功能性测试,在这些输入字符串中也包含了一些ASCII码小于32(ASCII码为32表示空格)的特殊字符。十种情况如下:

  • a=b

  1. len(a) < len(b)
  2. len(a) = len(b)
  3. len(a) > len(b)
  • a = b // c // d

  1. len(a) < len(b)
  2. len(a) = len(b)
  3. len(b) < len(a) < len(b) + len(c)
  4. len(a) = len(b) + len(c)
  5. len(b) + len(c) < len(a) < len(b) + len(c) + len(d)
  6. len(a) = len(b) + len(c) + len(d)
  7. len(a) > len(b) + len(c) + len(d)

将“f90_str_copy_klen”在函数中调用一亿次,对内联前后所花费的时间做对比。实验结果显示没有内联时运行花费的时间约为10秒,内联后运行花费的时间约为0.7秒。

  • 测试代码如下:
    主函数:main.f90

    programmain
    integer::i
    character(20)::a,b,c,d
    a="aaaaaaaaaaaaaaa"
    b="aaaaaaaaaaaaaaa"
    c="aaaaaaaaaaaaaaa"
    doi=1,100000000
    calltest(a,b,c,d,20)
    enddo
    end
    

    字符串拼接拷贝函数:test.f90

    subroutinetest(a,b,c,d,n)
    integer::n
    character(n)::a,b,c,d
    d=a//b//c
    endsubroutine
    
  • 测试方法如下:
    未优化前:

    $flangmain.f90-c
    $flangtest.f90-O3-c
    $flangmain.otest.o-oa.out
    $time./a.out
    

    real0m10.190s
    user0m10.180s
    sys0m0.004s

    优化之后(编译选项-Mx,218,0x1使能该优化功能)

    $flangmain.f90-c
    $flangtest.f90-O3–c–Mx,218,0x1
    $flangmain.otest.o-oa.out
    $time./a.out
    

    real0m0.706s
    user0m0.702s
    sys0m0.004s

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 函数
    +关注

    关注

    3

    文章

    4421

    浏览量

    67819
  • 编译器
    +关注

    关注

    1

    文章

    1672

    浏览量

    51889
  • Fortran
    +关注

    关注

    1

    文章

    7

    浏览量

    7850

原文标题:开源之夏 | 【结项报告】毕昇Fortran编译器内联动态库函数str_copy

文章出处:【微信号:openEulercommunity,微信公众号:openEuler】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    C编译器错误与解决方法

    C语言keil编译器提示错误的解决方法,可以帮你解决程序编译中的烦恼!! C编译器错误与解决方法 1. Warning 280:’i’:unreferenced local variable
    发表于 01-22 08:03

    在ADS编译器中,用标准的C库函数printf()需要哪些设置呢?

    在ADS编译器中,用标准的C库函数printf()需要哪些设置呢?又在哪儿可以看到printf()输出的信息呢?
    发表于 12-23 07:32

    内联函数介绍

    的消耗更小。如果参数是常量,编译器可以提供更好的优化。 内联函数的缺陷是如果调用的地方很多,代码的体积会变得很大。这主要取决于函数本身的大小和调用的次数。 仅对重要的
    发表于 12-12 07:08

    开源鸿蒙技术大会2025丨编译器与编程语言分论坛:语言驱动系统创新,编译赋能生态繁荣

    在万物智联的时代背景下,操作系统底层能力的构建离不开编程语言与编译器的关键支撑。作为开源鸿蒙生态的核心技术,语言设计与编译器、虚拟机实现的进步直接关系到开发效率、运行性能与系统安全。本次分论坛聚焦
    的头像 发表于 11-20 17:24 1130次阅读
    开源鸿蒙技术大会2025丨<b class='flag-5'>编译器</b>与编程语言分论坛:语言驱动系统创新,<b class='flag-5'>编译</b>赋能生态繁荣

    内联汇编的妙用

    它数据相关,于是借助循环变量i,做累加操作,但结果还是不对。 3、内联汇编(结果正确) 一觉醒来,突然想到内联汇编,决定一试:既然编译器不能如我所愿,那可以把想要的部分先自己编译
    发表于 10-31 06:28

    简单的内联汇编介绍

    ,只能采用内嵌汇编指令(CSR指令)的方式,才能对 CSR 寄存进行操作。 内联汇编程序 内敛汇编函数格式: asm volatile ( 汇编指令列表 : 输出操作数 // 非必需 : 输入操作数
    发表于 10-30 08:04

    RISC-V的工具链GCC内联汇编

    操作符列表。 5.“可能影响的寄存或存储”用来告诉编译器当前内联汇编语句可能会对某些寄存或存储
    发表于 10-30 06:59

    GCC编译器,怎么才能实现c文件中未被调用的函数,不会被编译呢?

    GCC编译器,怎么才能实现c文件中未被调用的函数,不会被编译?有什么编译选项可以设置吗? 移植代码,有些函数没被调用的
    发表于 09-28 12:25

    如何在Keil中将NuMicro BSP从Arm编译器5迁移到编译器6?

    在Keil中将NuMicro BSP从Arm编译器5迁移到编译器6!
    发表于 08-20 06:29

    C语言中的内联函数与宏

    在C编程中,内联函数和宏都用于避免函数调用的开销并编写可复用的逻辑部分,但它们在工作方式和安全性方面存在显著差异。
    的头像 发表于 07-25 15:10 2049次阅读
    C语言中的<b class='flag-5'>内联</b><b class='flag-5'>函数</b>与宏

    边缘设备AI部署:编译器如何实现轻量化与高性能?

    、ASIC等)上高效执行的机器代码。AI编译器在AI模型的部署和优化中扮演着关键角色,能够显著提升模型的运行效率和性能。   AI编译器的主要功能   AI编译器的主要功能包括模型优化、硬件适配、自动调优、
    的头像 发表于 07-06 05:49 6906次阅读

    编译器功能安全验证的关键要素

    在汽车、工业、医疗等安全关键型应用中,确保功能安全合规性需要严格的工具链验证。开发安全关键型软件的企业必须遵守ISO 26262、IEC 61508、ISO 62304等国际标准对编译器工具链进行全面的验证。
    的头像 发表于 07-05 13:37 1684次阅读

    兆松科技ZCC编译器全面支持芯来科技NA系列处理

    近日,兆松科技(武汉)有限公司(以下简称“兆松科技”)宣布正式发布高性能RISC-V编译器ZCC 4.0.0版本。
    的头像 发表于 06-11 09:56 1976次阅读

    MSP430常用内联函数说明

    电子发烧友网站提供《MSP430常用内联函数说明.docx》资料免费下载
    发表于 06-05 17:20 0次下载

    RVCT编译器是否比GNU的编译器的代码执行速度更快?

    使用FX3S遇到了RVCT编译器的问题。 1、在SDK的release note中有支持RVCT的描述, 但是在EZ USB Suite的设置中没有找到RVCT的选项, 请问支持的具体版本
    发表于 05-08 07:49