好文档 - 专业文书写作范文服务资料分享网站

C语言词法分析器和C语言语法分析器编译原理课程设计

天下 分享 时间: 加入收藏 我要投稿 点赞

《编译原理课程设计》课程报告

题目 C语言词法分析器和C-语言语法分析器

学生姓名 学生学号 指导教师

提交报告时间 2019 年 6 月 8 日

四川大学《编译原理课程设计》 学号2012141461017

C语言词法分析器

1 实验目的及意义

1. 熟悉C语言词法 2. 掌握构造DFA的过程

3. 掌握利用DFA实现C语言的词法分析器 4. 理解编译器词法分析的工作原理

2 词法特点及正则表达式

2.1词法特点

2.1.1 保留字 AUTO,

BREAK , CASE , CHAR , CONST ,

CONTINUE , DEFAULT , DO , DOUBLE , ELSE, ENUM , EXTERN , FLOAT , FOR , GOTO, IF , INT , LONG , REGISTER , RETURN, SHORT , SIGNED , SIZEOF , STATIC , STRUCT , SWITCH , TYPEDEF , UNION , UNSIGNED , VOID, VOLATILE , WHILE,

2.1.2 符号

+ - * / ++ -- += -= *= < <= > >= == != = ; , ( ) [ ] { } /* */ : 2.2 正则表达式

whitespace = (newline|blank|tab|comment)+

digit=0|..|9 nat=digit+

signedNat=(+|-)?nat NUM=signedNat(“.”nat)? letter = a|..|z|A|..|Z

ID = letter(letter|digit|“_”)+ CHAR = 'other+' STRING = “other+”

1

四川大学《编译原理课程设计》 学号2012141461017

3 Token定义

3.1 token类型 保留字 auto break case char const continue default do double else enum extern float for goto if int long redister return short signed sizeof static struct switch typedef union unsigned void volatile while + - * / ++ -- += -= *= < <= > >= == != = ; , ( ) [ ] { } /* */ : 特殊符号 文件结束、错误 EOF ERROR 其它token NUM ID CHARACTER STRING

3.2 tokenType类型代码

typedef enum { ENDFILE,ERROR, //错误、结束 //保留字 AUTO,BREAK,CASE,CHAR,CONST,CONTINUE ,DEFAULT , DO ,DOUBLE, ELSE, ENUM, EXTERN , FLOAT ,FOR , GOTO,IF, INT, LONG,REGISTER , RETURN, SHORT, SIGNED ,SIZEOF ,STATIC, STRUCT ,SWITCH, TYPEDEF ,UNION, UNSIGNED , VOID,VOLATILE , WHILE, ID,NUM,CHARACTER,STRING, //特殊符号 //{、}、/*、*/、: PLUS,MINUS,TIMES,OVER,SELFPLUS,SELFMINUS,PLUSASSIGN, MINUSASSIGN,TIMESASSIGN,LT,LEQ,GT,GEQ,EQ,NEQ,ASSIGN, SEMI,COMMA,LPAREN, MINUSASSIGN,TIMESASSIGN,LT,LEQ,GT, GEQ,EQ,NEQ,ASSIGN,SEMI,COMMA,LPAREN, RPAREN,LBRACKET,RBRACKET, LCBRACKET,RCBRACKET,LCOMMENT,RCOMMENT,COLON //其他token //+、-、*、/、++、--、+=、-=、*=、<、<=、>、>=、==、!=、=、;、,、(、)、[、]、 } TokenType; 2

四川大学《编译原理课程设计》 学号2012141461017

4 DFA设计

4.1 注释的DFA设计

注释的DFA如下所示,一共分为5个状态,在开始状态1时,如果输入的字符为/, 则 进入状态2,此时有可能进入注释状态,如果在状态2时,输入的字符为*,则进入注释状态,状态将转到3,如果在状态3时,输入的字符为*,则有可能结束注释状态,此时状态将转到状态4,如果在状态4时输入的字符为/,则注释状态结束,状态转移到结束 状态。

4.2 词法分析的DFA设计

词法分析的DFA如下所示,一共分为10个状态:START、INNUM、INNUM1、INNUM2、INID、INCOMPARE、INOPERATE、INSTRING、INCHAR、DONE。状态START表示开始状态,状态INNUM,INNUM1,INNUM2表示数字类型(NUM)Token的状态,状态INID表示标示符(ID)类型Token的状态,状态INOPERATE表示算数运算符型Token的状态,状态INOCOMPARE表示比较运算符型Token的状态,INSTRING表示字符串(STRING)类型Token的状态,INCHAR表示字符(CHARACTER)类型Token的状态,状态DONE表示接收状态。

?

在开始状态START时 ? ? ? ? ? ? ? ? ?

如果输入的字符为空白符,如空格换行等,则仍在START状态

如果输入的字符为digit,则进入状态INNUM,即可能是数字类型(NUM)Token的状态 如果输入的字符为letter,则进入状态INID,即可能是标识符类型Token的状态

如果输入的字符为>、<、!、=,则进入状态INCOMPARE,即可能是比较运算符型Token的状态 如果输入的字符为+、—、*、/,则进入状态INOPERATE,即可能是算数运算符类型Token的状态 如果输入的字符为‘,则进入状态INCHAR,即可能是字符类型Token的状态 如果输入的字符为“,则进入状态INSTRING,即可能是字符串类型Token的状态

如果输入的字符为是除以上之外的,则进入状态DONE,这次输入的字符可能是单目运算符、错误等

在状态INNUM时 ? ?

如果输入的字符为digit,则仍停留在INNUM状态 如果输入的字符为”.”,则转到INNUM1状态

3

四川大学《编译原理课程设计》 学号2012141461017

?

在状态INNUM1时 ? ? ?

如果输入的字符为digit,则进入INNUM2状态

在状态INNUM2时

如果输入的为其他的字符,则转到DONE状态 ? ?

如果输入字符为digit,则停留在INNUM2状态 如果输入的为其他字符,则转到DONE状态

? 在状态INID时 ? ?

如果输入的字符为letter或“_”或digit,则仍停留在INID状态 如果输入的为其他的字符,则转到DONE状态

? 在状态INCOMPARE时 ? ?

如果输入的字符为=,则转到DONE状态 如果输入的为其他的字符,则直接转到DONE状态

? 在状态INOPERATE时 ? ?

如果输入的字符为=,转到DONE状态

如果输入的为其他的字符,则直接转到DONE状态

? 在状态INCOMPARE时 ? ?

如果输入的字符为=,则转到DONE状态 如果输入的为其他的字符,则直接转到DONE状态

? 在状态INCHAR时 ? ?

如果输入为单引号,则转到DONE状态 如果输入的为其他字符,则停留在INCHAR状态

? 在状态INSTRING时 ? ?

如果输入为双引号,则转到DONE状态

如果输入的为其他字符,则停留在INSTRING状态

? 在状态DONE时

接受状态,根据分析过程中获取的字符串确定Token的类型,并生成和保存相应的Token

4

C语言词法分析器和C语言语法分析器编译原理课程设计

《编译原理课程设计》课程报告题目C语言词法分析器和C-语言语法分析器学生姓名学生学号
推荐度:
点击下载文档文档为doc格式
2qkth9j9337s7tu43p391qw0b8cvba00t5z
领取福利

微信扫码领取福利

微信扫码分享