东南大学编译原理词法分析报告器实验报告材料 - 图文

由天下分享时间：2025/1/6 20:53:26 加入收藏我要投稿点赞

实用文档

词法分析设计

1. 实验目的

通过本实验的编程实践，了解词法分析的任务，掌握词法分析程序设计的原理和构造方法，对编译的基本概念、原理和方法有完整的和清楚的理解，并能正确地、熟练地运用。

2. 实验内容

用C++语言实现对C++语言子集的源程序进行词法分析。通过输入源程序从左到右对字符串进行扫描和分解，依次输出各个单词的内部编码及单词符号自身值；若遇到错误则显示“Error”，然后跳过错误部分继续显示；同时进行标识符登记符号表的管理。

3. 实验原理

本次实验采用NFA->DFA->DFA0的过程:

对待分析的简单的词法（关键词/id/num/运算符/空白符等）先分别建立自己的FA，然后将他们用产生式连接起来并设置一个唯一的开始符，终结符不合并。

待分析的简单的词法（1）关键字：

\等（2）界符（查表）

（3）运算符

\,\relop：

（4）其他单词是标识符（ID）和整型常数（SUM），通过正规式定义。

id/keywords:

digit:

实用文档

（5）空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字，词法分析阶段通常被忽略。

空白、制表符和换行符:

4. 相关自动机描述 DFA:

DFA0：

实用文档

5. 流程图

实用文档

5. 核心数据结构描述

（1）生成的token序列由name、type、attr保存。

struct token{ };

（2）本文的大多数数据结构都用map来保存，优点是查找方便，大大提高时间复杂度。 map Keywords; //保存关键字 map Sep; //保存界符 map Relop; //保存比较运算符 map Op; //保存其他运算符 mapid; //保存输入字符串中的id mapnum; //保存数字

vectorToken; //保存token序列，大小未知，所以采用vector保存

string name; string type; int attr;

6. 核心算法描述

（1）void addToken(string s,int type）s为找到的字符串，type为可能类型。

将分析出来的token()序列添加到Token序列表中。如果是类型为1，查看关键词表，若找到，其类型为关键词并将其以类型为关键词存储到Token表中；若未找到，则查找id表，若找到，说明该id已经出现过，否则添加新的id到id表中，将该i字符串以类型为id添加到Token表中。如果类型为2，在界符表中查找，如果找到以类型为界符存储到Token表中，同理其他几种类型。可能类型为1--5，如果出现其他类型表示是词法分析器中发现额错误，将错误信息记录下来。

void addToken(string s,int type) {

switch(type){ case 1:

l_it=Keywords.find(s); if (l_it!=Keywords.end()){

token t={s,\,l_it->second}; Token.push_back(t); l_it=id.find(s); if (l_it==id.end()) {

id[s]=idNum;

token t={s,\,idNum++}; Token.push_back(t);

token t={s,\,l_it->second}; Token.push_back(t);

}else{

}else {

实用文档

}

break;