编译器优化教程：寄存器分配 1-电子发烧友网

概念介绍

在介绍算法之前，我们回顾下基本概念：

|X| ：X的度数，(无向图中)节点的邻居个数。
CFG ：控制流图。
successor ：本文指CFG中基本块的后继。
四元式 ：(op,result,arg1,arg2)，比如常见的a=b+c就可以看作四元式(+,a,b,c)。
SSA(Static Single Assignment) ：静态单赋值。
use/def ：举个例子，对于指令n: c <- c+b来说 use[n]={c,b}，def[n]={c}。
live-in ：当以下任一条件满足时，则称变量a在节点n中是live-in的，写作a∈in[n]。节点n本文中代表指令。
1. a∈use[n]；
2. 存在从节点n到其他节点的路径使用了a且不包括a的def。
live-out : 变量a在节点n的任一后继的live-in集合中。写作a∈out[n]
干涉：在某一时刻，两个变量在同一live-in集合中。
RIG(Register Interfere Graph) : 无向图，其点集和边集构成如下：
节点：变量
边：如果两节点存在干涉，那么这两节点之间就有一条干涉边
k-着色 ：给定无向图G=(V,E)，其中V为顶点集合，E为边集合。将V分为k个组，每组中没有相邻顶点，可称该图G是k着色的。当然可着色前提下，k越小越好。

需要注意的是，我们后续的算法会作用在最普通的四元式上，而不是SSA。在介绍寄存器分配算法之前，我们需要活跃变量分析来构建干涉图。

活跃变量分析与图着色算法

活跃变量分析

简单来说，就是计算每个点上有哪些变量被使用。

算法描述如下[1]：

input: CFG = (N, E, Entry, Exit)
begin
// init
for each basic block B in CFG
	in[B] = ∅
// iterate
do{
	for each basic block B other than Exit{
		out[B] = ∪(in[s]),for all successors s of B
		in[B] = use[B]∪(out[B]-def[B])
	}
}until all in[] do't change

活跃变量分析还有孪生兄弟叫Reaching Definitions，不过实现功能类似，不再赘述。

举个例子：对图1的代码进行活跃变量分析

图1[2]

可以得到每个点的活跃变量如图2所示：

图2

过程呢？限于篇幅，仅仅计算第一轮指令1的结果，剩余部分读者可自行计算。

步骤	下标	out	in
第一次迭代	1	{}	{b,c}
...	...	...	...

可画出RIG如图3：

图3

图着色

经过上文的活跃变量分析，我们得到了干涉图，下一步对其进行上色。

但是图着色是一个NP问题，我们会采用启发式算法对干涉图进行着色。基本思路是：

找到度小于k的节点;
从图中删除;
判断是否为可着色的图;
迭代运行前3步直到着色完成。

算法描述[3]：

input: RIG, k
// init
stack = {}
// iterate
while RIG != {} {
	t := pick a node with fewer than k neighbors from RIG // 这里RIG可以先按度数排序节点再返回
	stack.push(t)
	RIG.remove(t)
}
// coloring
while stack != {} {
	t := stack.pop()
	t.color = a color different from t's assigned colored neighbors
}

对于例子1，假设有4个寄存器r1、r2、r3、r4可供分配。

步骤	stack	RIG
0	{}

1	{a}

2	{d,a}

所以图3中的RIG是4-着色的。但如果只有三种颜色可用，怎么办呢？

没关系，我们还有大容量的内存，虽然速度慢了那么一点点。着色失败就把变量放在内存里，用的时候再取出来。

依然是上例，但是k=3，只有三个颜色。

如果f的邻居是2-着色的就好了，但不是。那就只能选一个变量存入内存了。这里我们选择将变量f溢出至内存。溢出后的IR和RIG如图：

图4 溢出后的IR

图5 溢出后的RIG

所以，溢出其实是分割了变量的生命周期以降低被溢出节点的邻居数量。溢出后的着色图如图6：

图6 着色后的图5

这里溢出变量f并不是明智的选择，关于如何优化溢出变量读者可自行查阅资料。

至此，图着色算法基本介绍完毕。不过，如果代码中的复制指令，应该怎么处理呢？

寄存器分配之前会有Copy Propagation和Dead Code Elimination优化掉部分复制指令，但是两者并不是全能的。

比如：代码段1中，我们可以合并Y和X。但是代码段2中Copy Propagation就无能为力了，因为分支会导致不同的Y值。

// 代码段1
X = ...
A = 10
Y = X
Z = Y + A
return Z

// 代码段2
X= A + B
Y = C
if (...) {Y = X}
Z = Y + 4

所以，寄存器分配算法也需要对复制指令进行处理。如何处理？给复制指令的源和目标分配同一寄存器。

那么如何在RIG中表示呢？如果把复制指令的源和目标看作 RIG中相同的节点 ，自然会分配同一寄存器。

相同节点？可以扩展RIG：新增虚线边，代表合并候选人。
成为合并候选人的条件是：如果X和Y的生命周期不重合，那么对于Y=X指令中的X和Y是可合并的。
为了保证合并合法且不造成溢出：合并后局部的度数

那么如何计算局部的度数？介绍三种算法：

简单算法
Brigg's 算法
George's 算法

简单算法：(|X|+|Y|)，很保守的算法但是可能会错过一些场景比如k=2时，图7应用简单算法是没办法合并的图7[3] 但明显图7可以合并成图8：图8[3]


Brigg's 算法：X和Y可合并，如果X和Y中度数≥k的邻居个数＜k。但是如果X的度数很大，算法效率就不高
George's算法：X和Y可合并，如果对Y的每个邻居T，|T|
‍比如k=2时，图9就可以合并X和Y。


图9[3]

相对于Brigg算法、George算法不用遍历节点的邻居。注意，图着色时可以按节点度数从小到大依次访问。

到此，图着色算法介绍完毕。


                    
                        声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。
                        举报投诉
                    
                    
                            
                                寄存器
                                
                                    
                                        
                                            
                                                寄存器
                                            
                                            +关注
                                        
                                        
                                        
                                            
                                                关注
                                                31
                                            
                                            
                                                文章
                                                5589
                                            
                                            
                                                浏览量
                                                129058
                                            
                                        
                                    
                                
                            

                                编译器
                                
                                    
                                        
                                            
                                                编译器
                                            
                                            +关注
                                        
                                        
                                        
                                            
                                                关注
                                                1
                                            
                                            
                                                文章
                                                1669
                                            
                                            
                                                浏览量
                                                51081
                                            
                                        
                                    
                                
                            

                                CFG
                                
                                    
                                        
                                            
                                                CFG
                                            
                                            +关注
                                        
                                        
                                        
                                            
                                                关注
                                                0
                                            
                                            
                                                文章
                                                10
                                            
                                            
                                                浏览量
                                                10098


                
                    
                        收藏
                        人收藏

                        
                            
                                
                                
                                    
                                        扫一扫，分享给好友
                                        
                                        复制链接分享
                                    
                                
                            
                        
                        
                          加入交流群
                          
                            
                              
                            
                            
                              扫码添加小助手
                              加入工程师交流群
                             
                          
                        
                    
                    
                    
                

                
                
                    评论
                


                
                                            
                        发布评论请先 登录
                
                
                  
                    相关推荐
                    热点推荐
                  
                  
                    
                                                    
    
        
            编译器优化那些事儿（5）：寄存器分配
    
    。至此，图着色算法基本介绍完毕。不过，如果代码中的复制指令，应该怎么处理呢？寄存器分配之前会有Copy Propagation和Dead Code Elimination优化掉部分复制指令，但是两者
    
                发表于 08-24 14:41        
                    

    

                              
    
        
            编译器优化的静态调度介绍
    
    约束条件进行联合求解得到的解决方案是相对更优的，但由于无论是指令调度还是寄存器分配，都是很复杂的NP完全问题，综合考虑下，编译器一般会分别处理二者。　　在LLVM编译器的设计中，
    
                发表于 03-17 17:07        
                    

    

                              
    
        
            多寄存器组网络处理器上的寄存器分配技术
    
    本内容提供了多寄存器组网络处理器上的寄存器分配技术
    
                发表于 06-28 15:26        
                •28次下载    

    

                        
                              
    
        
            编译器_keil的优化选项问题
    
    keil编译器的优化选项针对ARM，对STM32编译的一些优化的问题
    
                发表于 02-25 14:18        
                •3次下载    

    

                              
    
        
            高效的C编程之寄存器分配
    
    14.7 寄存器分配 编译器一项很重要的优化功能就是对寄存器的分配。与
    
                发表于 10-17 17:17        
                •4次下载    

    

                              
    
        
            C编译器及其优化
    
    本章将帮助读者在ARM处理器上编写高效的C代码。本章涉及的一些技术不仅适用于ARM处理器，也适用于其他RISC处理器。本章首先从ARM编译器及其优化

    
                发表于 10-17 17:22        
                •2次下载    

    

                              
    
        
            静态变量、自动变量与寄存器变量的存储
    
    register限定词通知编译器--程序中的变量将频繁使用。它的意思是建议编译器将程序中用register限定的变量放置在计算机的内部寄存其中，这样可能得到更小更快的程序。但是，编译器
    
                发表于 06-03 11:27        
        •3758次阅读            

    

                        
                              
    
        
            编译器优化对函数的影响
    
    编译器如gcc，可以指定不同的优化参数，在某些条件下，有些函数可能会被优化掉。
    
        
            	
                                    发表于 06-22 14:58        
        •3329次阅读            

    

                        
                              
    
        
            基于C++编译器的节点融合优化方法
    
    节点，减少诸如指令、寄存器、时钟周期和访存等开销，以达到减少程序运行时间，提升访存效率等目的。为了提升LLVM编译器的性能，文中在LLVM编译流程的中间表示阶段和DAG合并阶段、指令选择阶段提岀了节点融合
    
                发表于 06-15 14:29        
                •19次下载    

    

                              
    
        
            什么是编译器算法之寄存器分配
    
    寄存器是CPU中的稀有资源，如何高效的分配这一资源是一个至关重要的问题。本文介绍了基于图着色的寄存器分配算法。
    
        
            	
                                    发表于 03-02 16:11        
        •1965次阅读            

    

                        
                              
    
        
            怎么给D寄存器输入数值 三菱plc寄存器D怎么读取
    
    在单片机编程中，给D寄存器输入数值的方法取决于所使用的编程语言和编译器。
    
                发表于 04-12 13:33        
        •2.3w次阅读            

    

                              
    
        
            编译器的优化选项
    
    一个程序首先要保证正确性，在保证正确性的基础上，性能也是一个重要的考量。要编写高性能的程序，第一，必须选择合适的算法和数据结构；第二，应该编写编译器能够有效优化以转换成高效可执行代码的源代码，要做到
    
        
            	
                                    发表于 11-24 15:37        
        •1880次阅读            

    

                        
                              
    
        
            Keil编译器优化方法
    
    我们都知道，代码是可以通过编译器优化的，有的时候，为了提高运行速度或者减少代码尺寸，会开启优化选项。
    
        
            	
                                    发表于 10-23 16:35        
        •3180次阅读            

    

                        
                              
    
        
            Triton编译器与其他编译器的比较
    
    Triton编译器与其他编译器的比较主要体现在以下几个方面： 一、定位与目标 Triton编译器 ： 定位：专注于深度学习中最核心、最耗时的张量运算的优化。 目标：提供一个高度抽象、灵
    
        
            	
                                    发表于 12-24 17:25        
        •1586次阅读            

    

                              
    
        
            Triton编译器的优化技巧
    
    在现代计算环境中，编译器的性能对于软件的运行效率至关重要。Triton 编译器作为一个先进的编译器框架，提供了一系列的优化技术，以确保生成的代码既高效又适应不同的硬件架构。 
    
        
            	
                                    发表于 12-25 09:09        
        •1828次阅读

搜索历史

编译器优化教程：寄存器分配 1

概念介绍

活跃变量分析与图着色算法

活跃变量分析

图着色

评论