第9章 符号表
第十章 目标程序运行时的存储组织
课前索引
【课前思考】
◇ 回顾一般的编译过程,能否找到本章所讲内容在哪个过程? ◇ 为什么编译程序要考虑目标程序运行时存储区的管理和组织? ◇ 请归纳C语言和PASCAL语言的程序结构和数据类型的不同点 【学习目标】
全面了解目标程序运行时存储区的整体布局;每种存储区的组织方式和管理方法;并通过实例着重掌握,对允许过程嵌套定义的情况,栈式动态存储分配的组织方式和运行时进栈退栈的活动实现方法。 【学习指南】
在代码生成前,编译程序必须进行目标程序运行环境的配置和数据空间的分配。一般来讲,假如编译程序从操作系统中得到一块存储区以使目标程序在其上运行,该存储区需容纳生成的目标代码和目标代码运行时的数据空间。我们这里所说的??运行时的存储区组织,是指目标程序运行时的数据空间的管理和组织。 【难重点】
◇ 目标程序运行时,存储区域的整体布局,以及各区域的作用。 ◇ 各种不同类型的数据表示。
◇ 允许过程嵌套定义的情况,栈式动态分配的组织管理。 ◇ 对过程的调用,进入和退出时,栈式动态分配的工作原理。
◇ 过程活动纪录的各项内容和它们的作用,以及活动纪录的组织方式。 ◇ 过程参数传递的不同方式。 【知识结构】
第11章 代码优化
从逻辑上看,在代码生成前,编译程序必须进行目标程序运行环境的配置和数据空间的分配。一般来讲,假如编译程序从操作系统中得到一块存储区以使目标程序在其上运行,该存储区需容纳生成的目标代码和目标代码运行时的数据空间。数据空间应包括:用户定义的各种类型的数据对象(变量和常数)所需的存储空间,作为保留中间结果和传递参数的临时工作单元,调用过程时所需的连接单元,以及组织输入/输出所需的缓冲区。目标代码所占用空间的大小在编译时能确定。有些数据对象所占用的空间也能在编译时确定,其地址可以编译进目标代码中。而有些数据对象具有可变体积和待分配性质,无法在编译时确定存储空间的位置。
因此运行时的存储区常常划分成:目标区、静态数据区、栈区和堆区,如图10.1就是一种典型划分,代码(code)区用以存放目标代码,这是固定长度的,即编译时能确定的;静态数据区(static data)用以存放编译时能确定所占用空间的数据;堆栈区(stack and heap)用于可变数据以及管理过程活动的控制信息。
图10.1 目标程序运行时存储区的典型划分
code static data stack ↓ ↑ heap
所谓数据空间的分配,本质上看,是将程序中的每个名字与一个存储位置关联起来,该存储位置用以容纳名字的值。编译程序分配目标程序运行时的数据空间的基本依据是程序语言设计时对程序运行中存储空间的使用和管理办法的规定。我们知道,即便有些名字在程序中只声明了一次,但该名字可能对应运行时不同的存储位置,比如,一个递归调用的过程,在执行时,其同一个局部名字应该对应不同的运行空间位置以容纳每次执行时的值。在程序设计语言语义学中,使用术语environment表示将一个名字映射到一个存储位置的函数,术语state表示存储位置到值的映射,使用术语 environment函数表示 env: N→S (N到S的映射) 如图10.2所示。
图10.2 名字 到存储、到值的映射
编译程序分配目标程序运行时的数据空间的基本依据是程序语言设计时对程序运行中存储空间的使用和管理办法的规定。决定存储管理复杂程度的因素--源语言本身,比如源语言允许的数据类型有多少?语言中允许的数据项是静态确定还是动态确定?程序结构有什么特点,是段结构还是分程序结构?过程定义是否允许嵌套?等等。
源语言的结构特点、源语言的数据类型、源语言中决定名字作用域的规则等因素影响存储空间的管理和组织的复杂程度,决定数据空间分配的基本策略。
本章将介绍存储空间的使用管理方法,重点针对栈式动态存储分配的实现进行讨论。
第11章 代码优化
10.1 数据空间的三种不同使用方法和管理方法
数据空间的使用和管理方法分成三种:静态存储分配、栈式动态存储分配和堆式动态存储分配。
10.1.1 静态存储分配
这种存储分配非常简单,如果在编译时能确定目标程序运行中所需的全部数据空间的大小,编译时安排好目标程序运行时的全部数据空间,确定每个数据对象的存储位置,称这种分配策略为静态存储分配。如果一个名字的性质通过说明语句或隐式或显式规则而定义,则称这种性质是\静态\确定的。
像FORTRAN这样的语言,其程序是段结构的,即由主程序段和若干子程序段组成。各程序段中定义的名字一般是彼此独立的(除公共块和等价语句说明的名字以外),也即各段的数据对象名的作用域在各段中,同一个名字在不同的程序段表示不同的存储单元,不会在不同段间互相引用、赋值。另外它的每个数据名所需的存储空间大小都是常量(即不许含可变体积的数据,如可变数组),且所有数据名的性质是完全确定的。这样,整个程序所需数据空间的总量在编译时完全确定,从而每个数据名的地址就可静态进行分配。换句话说,一旦存储空间的某个位置分配给了某个数据名(关联起来)之后,在目标程序的整个运行过程中,此位置(地址)就属于该数据名了。
图10.4给出一个FORTRAN 77的程序例子。在图10.5中描述了该程序中局部变量的静态存储位置。
图10.4 一个FORTRAN 77的例子 (1) PROGRAM CNSUME
(2) CHARACTER * 50 BUF //程序体所拥有的静态量BUF (3) INTEGER NEXT //程序体所拥有的静态量NEXT
(4) CHARACTER C, PRDUCE //程序体所拥有的静态量C (5) DATA NEXT /1/, BUF / ' ' / (6) 6 C=PRDUCE()
(7) BUF(NEXT:NEXT)=C (8) NEXT=NEXT+1 (9) IF(C .EN. ' ' )GOTO 6 (10) (11) END
(12) CHARACTER FUNCTION PRDUCE() (13) CHARACTER * 80 BUFFER (14) INTEGER NEXT
(15) SAVE BUFFER, NEXT
//PRDUCE函数体所拥有的静态量BUFFER, NEXT (16) DATA NEXT /81/
(17) IF (NEXT .GT.80)THEN (18) (19) NEXT=1 (20) END IF
(21) PRDUCE=BUFFER(NEXT:NEXT) (22) NEXT=NEXT+1