E N D
编译原理 主讲: 羊四清 授课对象:计算机系 计算机科学与技术专业2004级 2007年上学期 第一章 引 论
学习编译原理的目的和意义 从简单实用主义看,学习编译原理是没有任何作用的,因为一般来说99%的程序员,不需要写自己的编译器,也不需要去读懂任何编译器代码。 但是我认为编译原理还是很值得一学的: 第一、学习编译原理可以帮助自己更加深层次的理解程序语言和内部机制。 第二、学习编译原理可以用来做简单的命令解释器,这个经常都很需要。比如游戏的脚本引擎。 第三、学习正则表达式,有很大的用处。 第四、它的理论基础坚实,其形式化系统不仅应用于编译技术,还大量应用于人工智能、多媒体技术及数据库等领域。 第一章 引 论
本课程的地位 • 计算机专业的专业基础课 • 是软件技术基础 • 是计算机专业的学生必修的一门主干课 • 是本学科研究生入学考试的课程之一 第一章 引 论
学习任务 • 掌握编译的理论基础和形式化系统 • 了解编译的全过程及其具体实现方法 第一章 引 论
学习方法 • 1、认真听课,认真理解书中的基本概念、基本原理与基本算法 • 2、弄懂书中的例题与习题 • 3、在看书时或理解例题时,一定要划出相应的细节变化过程,通过画图来加深理解 • 4、在理解的基础上记忆 • 5、理论结合实践 第一章 引 论
学习要求 • 成绩考核方法 • 平时成绩占30% • 期末考试成绩占70%。 • 平时成绩为: • 课堂点名10% • 作业10% • 上机实验10% 第一章 引 论
参考书 • 教材---陈火旺 刘春林等 程序设计语言编译原理 国防工业出版社 2000 • Tomas Pittmn, The art of Compiler Design theory and Practice, Prentice-Hall 1992 • ALFRED V. AHO, RAVISETHI, JEFFREY D. ULLMAN, Compilers Principles, Techniques and Tools ADDISSON-WESLEY 1986---龙书之称 • David A Watt & Deryck F Brown Programming language processors in java (in c ,in c++) compilers and interpreters, Prentice-Hall 2000 • Modern Compiler Implementation in C(美)Andrew W.Appel, Maia GinsburgCambridge University Press –虎书之称 第一章 引 论
参考书 • Terrence W.Pratt,Marvin V.Zelkowitz Programming Languages Design and Implementation, Prentice-Hall 1996 • Bennett, J.P.,Introduction to Compiling techniques: a first course using ANSI C,LEX and YACC.-2nd ed- , The McGRAW-HILL Publishing Company 1996 – • Modern Compiler Implementation in Java, Second Edition 2002年 虎书第2版 • David A. Watt, Programming Language Syntax and Semantics,Prentice Hall 1991 第一章 引 论
参考书 • 编译原理,清华大学出版社,吕映芝等编著,1998。 • 编译原理 技术与工具(英文版) • 编译原理与实践(英文影印版) • 高级编译器设计与实现 • 现代编译原理--C语言描述(英文影印版) • 现代编译原理-C语言描述 第一章 引 论
主要内容及课时安排 • 第1章 引论 2 • 第2章 高级语言及其语法描述 4 • 第3章 词法分析 8 • 第4章 语法分析—自上而下分析 6 • 第5章 语法分析—自下而上分析 8 • 第6章 属性方法和语法制导翻译 6 • 第7章 语义分析和中间代码生成 10 第一章 引 论
第8章 符号表 4 • 第9章 运行时存储空间组织 6 • 第10章 优化 3 • 第11章目标代码生成 3 • 第12章 并行编译基础 4 理论:64节(16*4) 上机及课程设计:26节 第一章 引 论
第一章 引论 1.1 什么叫编译程序 编译程序:是指这样的程序,它能够把某种语言的程序转换成另一种语言的程序,而后者与前者在逻辑上是等价的。如果源语言是诸如FORTRAN、Pascal、C、Ada、Smalltalk或Java这样的“高级语言”,而目标语言如汇编语言之类的“低级语言”这样的翻译程序则称之为编译程序。 第一章 引 论
编译程序又简称为“编译器” • 第一个编译器是20世界50年代的后期出现的FORTRAN语言编译器。 • 同样,解释程序又简称为“解释器”,但是在概念上与编译器有明显区别: 编译程序是源转换系统,而解释程序是源程序的一个执行系统。 编译程序的结果是得到等价源程序的某种目标机程序,而解释程序的结果是得到源程序的执行结果,即它相当于执行源程序的抽象机。 第一章 引 论
编译程序与解释程序的区别 一个语言的解释程序是着样的程序:它以该语言写的源程序作为输入,但不产生目标程序,而是边解释边执行源程序本身。 术语“编译”的内涵是实现从源语言表示的算法向目标语言表示的算法的等价变换。 第一章 引 论
编译程序的分类 • 诊断编译程序:用于帮助程序开发和调试 • 优化编译程序:提高目标代码的效率 • 宿主机:运行编译程序的计算机 • 目标机:运行编译程序所产生的目标代码的计算机 • 交叉编译程序:编译程序产生不同于宿主机的机器代码 • 可变目标程序代码:不需重编译程序中与机器无关的部分就能改变目标机。 第一章 引 论
交叉编译程序 编译程序在一个机器(宿主机)上运行,产生另一个机器(目标机)的汇编语言。嵌入式系统中的应用程序正是借助这样的编译程序生成。 第一章 引 论
1.2 编译过程概述 掌握编译过程的五个基本阶段,是我们学习编译原理课程的基本内容,把编译的五个基本阶段与英译中的五个步骤相比较,有利于对编译过程的理解: 第一章 引 论
1.识别出句子中的一个个单字 2.分析句子的语法结构 3.初步翻译句子的含意 4.译文修饰 5.写出最后译文 1.词法分析 2.语法分析 3.语义分析中间代码生成 4.优化 5.目标代码生成 英译与编译的比较 第一章 引 论
第一阶段:词法分析 词法分析的任务: 输入源程序,对构成源程序的字符串进行扫描和分解,识别出一个个单词(也称单词符号,或简称符号) 工具: 在词法分析阶段工作所依循的是语言的词法规则。描述词法规则的有效工具是正规式和有限自动机。 第一章 引 论
第二阶段:语法分析 语法分析的任务: 在词法分析的基础上,根据语言的语法规则,把单词符号分解成各类语法单位(语法范畴),如“短语”、“句子”、 “子句”、“程序段”等。 工具: 语法规则通常用上下文无关文法描述。 第一章 引 论
第三阶段:语义分析与中间代码的产生 任务: 这一阶段通常包括两方面的工作首先对各种语法范畴进行静态语义检查,如果正确则进行另一方面的工作,即进行中间代码的翻译。 工具: 通常使用属性文法描述语义规则 所谓“中间代码”是一种含义明确,便于处理的记号系统。 中间代码除四元式外,还有三元式、间接三元式、逆波兰记号、树形表示等。 第一章 引 论
第四阶段:优化 任务: 优化的任务在于对前段产生的中间代码进行加工,以期在最后阶段产生更为高效(省时间和空间)的代码 工具: 优化所依循的原则是程序的等价变换规则. 其方法有:公共子表达式的提取、循环优化、删除无用代码等。 第一章 引 论
第五阶段:目标代码生成 任务: 把中间代码(或经优化处理后)变换成特定机器上的低级语言代码。它有赖于硬件系统结构和机器指令含义。 目标代码的形式可以是绝对指令代码或可重定位的指令代码可汇编指令代码. 第一章 引 论
1.3 编译程序的结构 源程序 词法分析器 单词符号 表 格 管 理 出 错 处 理 语法分析器 语法单位 语义分析与中间代码产生 中间代码 优化器 中间代码 目标代码生成器 第一章 引 论 目标代码
1.3.2 表格与表格管理 从上图中我们可以看到除编译的五个基本阶段外,一个完整的编译程序还应包括“表格管理”和“出错处理”两部分 在编译程序使用的表格中最重要的是符号表它用来登记源程序中出现的每一个名字以及名子的各种属性。如一个名字是常量名、变量名,还是过程名等;如果是变量名它的类型又是什么、所站内存是多大、地址是什么等。 第一章 引 论
1.3.3 出错处理 一个编译程序不仅能对书写正确的程序进行编译,而且应能对处现在源程序中的错误进行处理。如果源程序有错,编译程序应设法发现错误,把有关错误报告给用户。这部分的工作是由专门的一组程序(叫做处错处理程序)完程的。 第一章 引 论
1.3.4 遍 • 遍:就是对源程序或源程序的中间结果从头到尾扫描一次,并作胡关的加工处理,生成新的中间结果或目标程序. • 遍的划分:可以将多个阶段划分为遍,也可以将1个阶段划分为多遍. 第一章 引 论
1.3.5 编译前端与后端 前端主要由与源语言有关但与目标机无关的那些部分组成。通常包括词法分析、语法分析、语义分析与中间代码产生,有的代码优化工作,也可以包括在前端。 后端包括编译程序中与目标代码有关的部分,如与目标机有关的有关的优化,和目标代码的生成等。 第一章 引 论
1.4 编译程序与程序设计环境 编译程序无疑是实现高级语言的一个最重要的工具。但支持程序设计人员进行程序设计开发通常还需要其它一些工具:如编辑程序、连接程序、调试程序等。编译程序与这些程序设计工具一起构成所谓的程序设计环境。 在一个程序设计环境中,编译程序起着中心的作用。连接程序、调试程序、程序分析等工具直接依赖于编译程序所产生的结果,而其它工具的构造也常常要用到编译的原理、方法和技术。 第一章 引 论
Ada程序设计环境--APSE APSE MAPSE …… 编辑程序 编译程序 KPSE 宿主机 配置管理程序 调试程序 命令解释程序 连接程序 第一章 引 论
1.5 编译程序的生成 以前构造编译程序大多是用机器语言或汇编语言作工具的。为了充分发挥各种不同硬件系统的效率,为了满足各种不同的具体要求,现在许多人仍然使用这种工具来构造编译程序(或编译程序的核心部分) 但是越来越多的人已经使用高级语言作工具来编译程序。因为这样可以大大节省程序设计的时间,热切构造出来的编译程序易于阅读、维护和移植。 第一章 引 论
T形图 为此我们用T形图来表示源语言S、目标语言T和编译语言I(宿主语言)之间的关系。 S T I 第一章 引 论
L1语言 L2语言 L2语言 A代码 A代码 A代码 A代码 L1语言 A代码 用L1语言编写编译程序 如果A机器上已有一个用A机器码实现的某高级语言L1的编译程序,则我们可以用L1语言编写另一种高级语言L2的编译程序,把写好的L2编译程序经过L1编译程序编译后就可得到A机器代码实现的L2编译程序。 第一章 引 论
我们还可以采用“自编译方式”产生编译程序。方法是,先对语言的核心部分构造一个小小的编译程序(可用低级语言实现),再以他为工具构造一个能够编译更多语言成分的较大编译程序。如此扩展下去,就像滚雪球一样,越滚越大,最后形成人们所期望的整个编译程序。这种通过一系列的自展途径而形成编译程序的过程叫做自编译过程。我们还可以采用“自编译方式”产生编译程序。方法是,先对语言的核心部分构造一个小小的编译程序(可用低级语言实现),再以他为工具构造一个能够编译更多语言成分的较大编译程序。如此扩展下去,就像滚雪球一样,越滚越大,最后形成人们所期望的整个编译程序。这种通过一系列的自展途径而形成编译程序的过程叫做自编译过程。 第一章 引 论
现在将编译器移植到一个新的主机,只要求重写源代码的后端来生成新机器的代码。接着用旧的编译器来编译它以生成一个交叉编译器,该编译器又再次被交叉编译器重新编译,以得到新机器的工作版本。图1 - 3 a和图1 - 3 b描述了这一过程。 第一章 引 论
这里主要研究过程式语言的编译 高级语言分类及其编译: 过程式语言:FORTRAN Pascal ADA C 函数式语言:LISP ML ASL 逻辑式语言:PROLOG 对象式语言:SMALLTALK C++ 函数式语言与逻辑式语言,特别是逻辑式语言,其编译技术与过程式语言的差别比较大;因对象式语言的载体基本上是过程式的,所以其编译程序也不难理解。 第一章 引 论