指导教师 : 杨建国

编译原理 指导教师:杨建国二零一零年三月

第八章　语法制导翻译和中间代码生成 • 第一节属性文法 • 第二节语法制导翻译概论 • 第三节中间代码的形式 • 第四节简单赋值语句的翻译 • 第五节布尔表达式的翻译 • 第六节控制结构的翻译 • 第七节说明语句的翻译 • 第八节数组和结构的翻译

知识结构

第八章　语法制导翻译和中间代码生成 • 8.1　属性文法 • 语义处理的功能： • 静态语义审查：验证语法结构合法的程序是否真正有意义 • 翻译：生成中间代码或目标代码

静态语义审查： • 类型检查：验证程序中执行的每个操作是否遵守语言　的类型系统的过程，编译程序必须报告不符合类型系　统的信息 • 控制流检查：控制流语句必须使控制转移到合法地方 • 一致性检查：在很多场合要求对象只能被定义一次 • 相关名字检查：有时，同一名字必须出现两次或多次 • 名字的作用域分析：

中间代码（中间语言）： • 是复杂性介于源程序语言和机器语言的一种表示形式 • 一般，快速编译程序直接生成目标代码 • 为了使编译程序结构在逻辑上更为简单明确，常采用中间　代码，这样可以将与机器相关的某些实现细节置于代码生　成阶段仔细处理，并且可以在中间代码一级进行优化工作　使得代码优化比较容易实现

语义分析的任务: • 翻译说明语句，把名字的属性登记到符号表中 • 翻译可执行语句，设计出目标代码结构，给出变换方法，将可执行语句变换为目标代码

一个属性文法是一个三元组A＝（G，V，F）： • G：一个上下文无关文法 • V：一个属性的有穷集 • F：关于属性的断言或谓词的有穷集 • V 中的每个属性与文法的某个非终结符或终结符相联　系, 可以是“类型”、“值”或“存储位置” • F 中的每个断言与文法的某个产生式相对应, 可以是语　义规则或者程序段等 • 因此可知, 一个属性文法包含一个上下文无关文法和　一系列语义规则，这些语义规则附在每个产生式上

例如文法G为： • ET1+T2| T1 or T2 • Tnum| true |false • 对输入串3+4的语法树如图：图8.1 静态语义审查

属性文法记号中常使用N.T的形式表示与非终结符N相属性文法记号中常使用N.T的形式表示与非终结符N相　联的属性t • 类型检查的属性文法如下: • E→T1+T2 { T1.type = int AND T2.type =int } • E→T1 or T2 { T1.type = bool AND T2.type =bool } • T →num { T.type := int } • T → true { T.type := bool } • T → false { T.type := bool }

属性文法最早由克努特(D.E.Knuth)提出，他把属性分成：属性文法最早由克努特(D.E.Knuth)提出，他把属性分成：　继承属性、综合属性 • 属性文法中，对应于每个产生式Aa都有一套与之相关　联的语义规则，每条规则的形式为b:=f(c1,c2,…,ck)。 f是一个函数，b和c1,c2,…,ck是该产生式文法符号的属性（1）如果b是A的一个属性，c1,c2,…,ck是产生式右部文法　符号的属性或A的其他属性，则称b是A的综合属性（2）如果b是产生式右部某个文法符号X的一个属性，并且 c1,c2,…,ck是A或产生式右边任何文法符号的属性，则称b 　是文法符号X的继承属性

对每个产生式，设属性定义性出现的集合为 • 若Xi是产生式左部非终结符（即i=0），则称属性Xi.a是综合属性（SynthesizedAttributes） • 若Xi出现在产生式的右部（即），则称Xi.a是继承属性（ Inherited Attributes） • 例如：Ap Xq,r Ys,t [p=q+s,r=p+t]其中，p、q、r、s、t 　是属性，分别属于A、X和Y，则： p是综合属性，r是继承属于，而q、s、t的性质不能确定

在计算时： • 综合属性沿属性语法树向上传递 • 继承属性沿属性语法树向下传递 • 若产生式左部的单非终结符A的属性值由右部各非终结符的　属性值决定, 则A的属性称为综合属性 • 若产生式右部符号B的属性值是根据左部非终结符的属性值　或者右部其它符号的属性值决定的,则B的属性为继承属性

在两种情况下，我们说属性b依赖于属性c1,c2,…,ck在两种情况下，我们说属性b依赖于属性c1,c2,…,ck (1)非终结符既可有综合属性也可有继承属性，但文法开始符号没有继承属性（2）终结符只有综合属性，它们由词法程序提供

例8.1　简单算术表达式求值的语义描述： 　产生式　　　　　　　　　　语义规则　　（0）LEnprint(E.val) 　（1）EE1+TE.val:=E1.val+T.val 　（2）ETE.val:=T.val 　（3）TT1*FT.val:=T1.val×F.val 　（4）TFT.val:=E.val 　（5）F(E)F.val:=E.val 　（6）FdigitF.val:=digit.lexval E、T和F的val属性是综合属性,digit仅有综合属性，它　的值是由词法分析程序提供的，L的属性是空的，n换行符

例8.2　描述说明语句中各种变量的类型信息的语义规则：例8.2　描述说明语句中各种变量的类型信息的语义规则： • 产生式　　　　　　　　　　语义规则　　（1）DTLL.in:=T.type 　（2）TintT.type:=integer 　（3）TrealT.type:=real 　（4）LL1,idL1.in:=L.in addtype(id.entry,L.in) 　（5）Lidaddtype(id.entry,L.in) • 过程addtype的功能是把每个标识符的类型信息登录在符号表的相关项中 • T的综合属性type,它的值由(int或real)决定,L.in是继承属性

图8.3是句子 int id1,id2的语法树，使用　　表示属性的传递情况图8.3　属性信息传递情况

8.2　语法制导翻译概论 • 语法制导翻译是指在语法分析过程中，完成附加在所　使用的产生式上的语义规则描述的动作 • 基于属性文法的处理过程（语法制导翻译）：　　对单词符号串进行语法分析，构造语法分析树，然后根据需要构造属性依赖图，遍历语法树并在语法树的各结点处按语义规则进行计算

一.计算语义规则 • 依赖图：是一个有向图，用于描述分析树中的属性和属性　间的相互依赖关系

依赖图的构造算法如下： for 分析树中每一个结点n do for 结点的文法符号的每一个属性a do 为a在依赖图中建立一个结点； for 分析树中每一个结点 n do for 结点n所用产生式对应的每一个语义规则　 b:=f(c1,c2,…,ck) do for i:=1 to k do 从ci结点到b结点构造一条有向边

D L in 6 5 T 4 type , in L 3 entry id3 7 8 Real , L 2 entry in id2 9 10 id1 1 entry • 例8.2的句子Real id1,id2,id3分析树的依赖图（图中的结点　用数字表示）如图8.4：

从依赖图的拓扑排序中，可以得到所有计算语义规则的顺从依赖图的拓扑排序中，可以得到所有计算语义规则的顺　序。用这个顺序来计算语义规则就得到输入符号串的翻　译 • 属性计算有树遍历的和一遍扫描的方法

二.S－属性文法和自下而上翻译 • S-属性文法是只含有综合属性的属性文法 • 综合属性可以在分析输入符号串的同时自下而上来计算 • S－属性文法的翻译器通常可借助于LR分析器实现 • 分析器可以保存与栈中文法符号有关的综合属性值，每当　进行归约时，新的属性值就由栈中正在归约的产生式右　边符号的属性值来计算

对例8.1的输入串2+3*5语法树如图8.5：

假定有一个LR语法分析器，现在把它的分析栈扩充，使假定有一个LR语法分析器，现在把它的分析栈扩充，使　得每个文法符号都跟有语义值，即把栈的结构看成图8.6 　所示：

同时把LR分析器的能力扩大，使它不仅执行语法分析任同时把LR分析器的能力扩大，使它不仅执行语法分析任　务，还能在用某个产生式进行归约的同时调用相应的语　义子程序，完成在例8.1的属性文法中描述的语义动作 • 每步工作后的语义值保存在扩充栈的“语义值栈”栏中 • 采用的LR分析表为表7.8，不过要将其中的i改为digit，分　析和计值2+3*5的过程列在图8.7所示：

S5 S4 1 2 3 S6 acc r2 S7 r2 r2 r4 r4 r4 r4 S5 S4 8 2 3 r6 r6 r6 r6 S5 S4 9 3 S5 S4 10 S6 S11 r1 S7 r1 r1 r3 r3 r3 r3 r5 r5 r5 r5

-2-3-5 2+3*5的分析和计值过程

三.L－属性文法在自上而下分析中的实现 • 一个属性文法称为L－属性文法，如果对于每个产生式 AX1X2…Xn,其每个语义规则中的每个属性或者是综　合属性，或者是Xj(1≤j ≤n)的一个继承属性且这个继承　属性仅依赖于：（1）产生式Xj在左边符号X1,X2,…Xj-1的属性（2）A的继承属性

例8.2描述变量证明语句中类型信息的属性文法是L－属性例8.2描述变量证明语句中类型信息的属性文法是L－属性　文法 • S－属性文法一定是L－属性文法，因为（1）、（2）限制　只用于继承属性 • L－属性文法允许一次遍历就计算出所有属性值

例8.3　将中缀表达式翻译成相应的后缀表达式的属性文法,例8.3　将中缀表达式翻译成相应的后缀表达式的属性文法, 其中addop表示+或- • EE addop T print(addop,Lexeme) | T • Tnum print(num,val) 　　比如对串2+3-5的分析同时执行语义动作打印出23+5-

语法分析树中加虚线联结的语义结点，形成一个可说明语义语法分析树中加虚线联结的语义结点，形成一个可说明语义　动作的树，如图8.8：

LL(1)这种自上而下分析文法的分析过程，从概念上说可以LL(1)这种自上而下分析文法的分析过程，从概念上说可以　看成是深度优先建立语法树的过程，因此，可以在自上而　下语法分析的同时实现L属性文法的计算

例8.3是一个含左递归规则的文法，如采用LL（1）分析必例8.3是一个含左递归规则的文法，如采用LL（1）分析必　须改写文法如下： • ETR • Raddop TR1｜ε • Tnum 这时2+3-5的语法树如图8.9：

将后缀式23+-5输出的动作在语法树中应出现的位置如图将后缀式23+-5输出的动作在语法树中应出现的位置如图 8.10所示：

例8.4　（中缀表达式翻译成相应的后缀表达式）：例8.4　（中缀表达式翻译成相应的后缀表达式）： • ETR • Raddop T｛print(addop,Lexeme)}R1｜ε • Tnum {print(num.val)} • 把语义动作嵌在右部文法符号T和R之间，这种语义处理的　描述形式称为翻译模式 • 翻译模式是适合语法制导翻译的另一种描述形式 • 翻译模式给出了使用语义规则进行计算的次序，可把某些　实现细节表示出来

一般转换左递归翻译模式的方法简述如下： • 假设翻译模式为： • AA1Y{A.a:=g(A1.a,Y.y)} • AX {A.a:=f(X.x)} • 每个文法符号都有一个综合属性，用相应的小写字母表示, g和f是任意函数。消除左递归，文法转换成： • AXR • RYR｜ε

再考虑语义动作，则翻译模式为，其中使用了R的继承属性再考虑语义动作，则翻译模式为，其中使用了R的继承属性 i和综合属性s: • AX{R.i:=f(X.x)} R {A.a:=R.s} • RY {R1.i:=g(R.i,Y.y)} R1 {R.s:=R1.s} • Rε {R.s:=R.i}

四.L－属性文法在自下而上分析中的实现 • 实现自下而上计算继承属性方法： • 方法一：从翻译模式中去掉嵌入在产生式中间的动作　引入新的非终结符N和产生式Nε，把嵌入在生产式中间的动作用非终结符N代替，并把这个动作放在产生式后面

例如下面的翻译模式： • ET R • R+T{print(‘+’)}R1 • R-T {print(‘-’)}R1 • Rε • Tnum{print(num,val)}

引入M和N，变换后的翻译模式如下，原嵌入在产生式中间引入M和N，变换后的翻译模式如下，原嵌入在产生式中间　的动作都在产生式后面了 • ET R • R+TMR1 • R-T NR1 • Rε • Tnum{print(num,val)} • Mε{print(‘+’)} • Nε{print(‘-’)}

方法二：用综合属性代替继承属性，改变基础文法是一种可方法二：用综合属性代替继承属性，改变基础文法是一种可　能的办法 • 例如，一个Pascal的说明由一标识符序列后跟类型组成，如 m,n:integer。这种说明语句的文法可由下面的形式的产生　式构成： • DL:T • Tinteger|char • LL,id|id

一个解决的方法是重新构造文法，借以实现用综合属性代一个解决的方法是重新构造文法，借以实现用综合属性代　替继承属性 • 例如一个等价的文法如下： • Did L • L,id L |:T • Tinteger|char • 属性文法如下： • Did L {addtype(id.entry,L.type)} • Lid L1{L.type:=L1.type:addtype(id.entry,L.type)} |:T{L.type:=T.type} • Tinteger{T.type:=int}|char{T.type:=ch}

8.3　中间代码的形式 一.逆波兰式（后缀式）(后根遍历） • 由波兰逻辑学家卢卡西维奇发明 • 这种表示法将运算对象写在前面，把运算符号写在后面 • 图8.11给出了程序设计语言中的逆波兰表示形式： a*b ab* a*b+c ab*c+ a*(b+c/d) abcd/+* a*b+c*d ab*cd*+

例如　B@CD*+（它的中缀表示：-B+C*D)的计值过程为：例如　B@CD*+（它的中缀表示：-B+C*D)的计值过程为： 1.B进栈 2.对栈顶元素施行一目运算，并将结果代替栈顶,即-B置于栈顶 3.C进栈 4.D进栈 5.栈顶两元素相乘，两元素退栈，相乘结果置栈顶 6.栈顶两元素相加，两元素退栈，相加结果进栈，现在栈顶存　放的是整个表达式的值

二.三元式和树形表示 • 每个三元式的组成：(op，ARG1，ARG2) • 例如：a:=b*c+b*d (1)(*, b,c) (2)(* ,b,d) (3)(+ ,(1),(2)) (4)(:= ,(3),a) • 树形表示是三元式表示　的翻版，上述三元式可　表示成右边的树表示：

表达式的树形表示很容易实现：简单变量或常数的树就是表达式的树形表示很容易实现：简单变量或常数的树就是　该变量或常数自身，如果表达式e1和e2的树分别为T1和 T2，那么e1+e2,e1*e2,-e1的树分别为：

三.四元式 • 四元式的组成：(op，ARG1,ARG2,RESULT) • 例如：a:=b*c+b*d (1)(*, b,c,t1) (2)(*, b,d,t2) (3)(+ ,t1,t2,t3) (4)(:= ,t3,－,a)

为了直观，也把四元式的形式写成简单赋值形式：为了直观，也把四元式的形式写成简单赋值形式： (1)t1:=b*c (2)t2:=b*d (3)t3:=t1+t2 (4)a:=t3 (jump,-,-,L) goto L (jrop,B,C,L) if B rop C goto L

例题：写出算术表达式： A+B*(C－D)+E/(C－D)↑N ①四元式 ②三元式 ③间接三元式 ④逆波兰 ⑤树形表示

指导教师 : 杨建国

指导教师 : 杨建国

Presentation Transcript