二级共公基础知识
第一章数据结构与算法 1.1 算法
算法:是指解题方案的准确而完整的描述。
算法不等于程序,也不等计算机方法,程序的编制不可能优于算法的设计。
算法的基本特征:是一组严谨地定义运算顺序的规则,每一个规则都是有效的,是明确的,此顺序将在有限的次数下终止。特征包括: (1)可行性;
(2)确定性,算法中每一步骤都必须有明确定义,不充许有模棱两可的解释,不允许有多义性;
(3)有穷性,算法必须能在有限的时间内做完,即能在执行有限个步骤后终止,包括合理的执行时间的含义; (4)拥有足够的情报。
算法的基本要素:一是对数据对象的运算和操作;二是算法的控制结构。 指令系统:一个计算机系统能执行的所有指令的集合。
基本运算和操作包括:算术运算、逻辑运算、关系运算、数据传输。 算法的控制结构:顺序结构、选择结构、循环结构。
算法基本设计方法:列举法、归纳法、递推、递归、减斗递推技术、回溯法。 算法复杂度:算法时间复杂度和算法空间复杂度。 算法时间复杂度是指执行算法所需要的计算工作量。 算法空间复杂度是指执行这个算法所需要的内存空间。 1.2 数据结构的基本基本概念 数据结构研究的三个方面:
(1)数据集合中各数据元素之间所固有的逻辑关系,即数据的逻辑结构;
(2)在对数据进行处理时,各数据元素在计算机中的存储关系,即数据的存储结构; (3)对各种数据结构进行的运算。
数据结构是指相互有关联的数据元素的集合。 数据的逻辑结构包含:
(1)表示数据元素的信息;
(2)表示各数据元素之间的前后件关系。 数据的存储结构有顺序、链接、索引等。 线性结构条件:
(1)有且只有一个根结点;
(2)每一个结点最多有一个前件,也最多有一个后件。 非线性结构:不满足线性结构条件的数据结构。 1.3 线性表及其顺序存储结构
线性表由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。 在复杂线性表中,由若干项数据元素组成的数据元素称为记录,而由多个记录构成的线性表又称为文件。 非空线性表的结构特征:
(1)且只有一个根结点a1,它无前件; (2)有且只有一个终端结点an,它无后件;
(3)除根结点与终端结点外,其他所有结点有且只有一个前件,也有且只有一个后件。结点个数n称为线性表的长度,当n=0时,称为空表。
线性表的顺序存储结构具有以下两个基本特点:
(1)线性表中所有元素的所占的存储空间是连续的;
(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。
ai的存储地址为:ADR(ai)=ADR(a1)+(i-1)k,,ADR(a1)为第一个元素的地址,k代表每个元素占的字节数。 顺序表的运算:插入、删除。 (详见14--16页) 1.4 栈和队列
栈是限定在一端进行插入与删除的线性表,允许插入与删除的一端称为栈顶,不允许插入与删除的另一端称为栈底。
栈按照“先进后出”(FILO)或“后进先出”(LIFO)组织数据,栈具有记忆作用。用top表示栈顶位置,用bottom表示栈底。 栈的基本运算:(1)插入元素称为入栈运算;(2)删除元素称为退栈运算;(3)读栈顶元素是将栈顶元素赋给一个指定的变量,此时指针无变化。
队列是指允许在一端(队尾)进入插入,而在另一端(队头)进行删除的线性表。Rear指针指向队尾,front指针指向队头。 队列是“先进行出”(FIFO)或“后进后出”(LILO)的线性表。 队列运算包括(1)入队运算:从队尾插入一个元素;(2)退队运算:从队头删除一个元素。 循环队列:s=0表示队列空,s=1且front=rear表示队列满 1.5 线性链表
数据结构中的每一个结点对应于一个存储单元,这种存储单元称为存储结点,简称结点。 结点由两部分组成:(1)用于存储数据元素值,称为数据域;(2)用于存放指针,称为指针域,用于指向前一个或后一个结点。
在链式存储结构中,存储数据结构的存储空间可以不连续,各数据结点的存储顺序与数据元素之间的逻辑关系可以不一致,而数据元素之间的逻辑关系是由指针域来确定的。
链式存储方式即可用于表示线性结构,也可用于表示非线性结构。 线性链表,HEAD称为头指针,HEAD=NULL(或0)称为空表,如果是两指针:左指针(Llink)指向前件结点,右指针(Rlink)指向后件结点。
线性链表的基本运算:查找、插入、删除。 1.6树与二叉树 一、树的基本概念
在树结构中,每一个结点只有一个前件,称为父结点,没有前件的结点只有一个,称为树的根结点,简称为树的根。 在树结构中,每一个结点可以有多个后件,它们都称为该结点的子结点。没有后件的结点称为叶子结点。 在树结构中,一个结点所拥有的后件个数称为该结点的度。 叶子结点的度为0。
树的最大层次称为树的深度。
在一个算术表达式中,有运算符和运算对象。一个运算符可以有若干个运算对象。例职,取正(+)等只有一个运算对象,称为单目运算符;二个运算对象称为双目运算符,三目运算符。 用树来表示算术表达式的原则如下:
表达式中的每一个运算符在树中对应一个结点,称为运算符结点。
运算符的每一个运算对象在树中为该运算符结点的子树(在树中的顺序为从左到右)。 运算对象中的单变量均为叶子结点。 二、二叉树及其基本性质 1、什么是二叉树
二叉树是一种很有用的非线性结构。二就树具有以下两个特点: 非空二叉树只有一个根结点;
每一个结点最多有两棵子树,且分别称为该结点的左子树与右子树。
由以上特点可以看出,在二叉树中,每一个结点的度最大为2,即所有子树(左子树或右子树)也均为二叉树,而树结构中的每一个结点的度可以是任意的。另外,二叉树中的每一个结点的子树被明显地分为左子树与右子树。可以没有其中的一个,也可以全没有。 二叉树的基本性质
性质1:在二叉树的第K层上,最多有(K≥1)个结点。 性质2:浓度为M的二叉树最多有2m-1 个结点。 深度为m 的二叉树是指二叉树共有m层。
性质3:在任意一棵二叉树中度为0的结点(即叶子结点)总是比度为2的结点多一个。 性质4:具有n个结点的二叉树,其深度至少为[ log2n]+1,其中[ log2n]表示取的整数部分。 满二叉树与完全二叉树
满二叉树与完全二叉树是两种特殊形态的二叉树。 满二叉树
所谓满二叉树是指这样的一种二叉树;除最后一层外,每一层上的所有结点都有两个子结点。这就是说,在满二叉树中,每一层上的结点数都达到最大值,即在满二叉树的第K层上有2K-1个结点,且深度为m的满二叉树有2m-1个结点。 完全二叉树
所谓完全二叉树是指这样的二叉树,除最后一层外,每一层上的结点数均达的最大值;在最后一层上只缺少右边的若干结点。 列确切地说,如果从根结点起,对二叉树的结点自上而下、自左至右用自然数进行边疆编号,则深度为m、且有n 个结点的二叉树,当且仅当其每一个结点都与深度为m的满二叉树中编号从1到n的结点一一对应时,称之为完全二叉树。
对于完全二叉树来说,叶子结点只可能在层次最大的两层上出现;对于任何一个结点,若其右分支下的子孙结点的最大层次为p,则其左分支下的子孙结点的最大层次或为p,或为p+1。
由满二叉树与完全二叉树的特点可以看出,满二叉树也是完全二叉树,而完全二叉树一般不是满二叉树。 完全二叉树还具有以下两个性质:
性质5:具有n个结点的完全二叉树的深度为[ log2n]+1。
性质6:设完全二叉树共有n个结点。如果从根结点开始,按层序(每一层从左到右)用自然数1,2,…,n给结点进行编号,则对于编号为k (k=1,2,…n)的结点有以下结论:
若k=1,则该结点为根结点,它没有父结点;若k>1,则该结点的父结点编号为INT(k/2)。
若2k≤n,则编号为k 的结点的左子结点编号为2k ;否则该结点无左子结点(显然也没有右子结点)。 若2k+1≤n,则编号为k 的结点的右子结点编号为2k+1;否则该结点无右子结点。 三、二叉树的存储结构 二叉树的遍历
二叉树的遍历是指不重复地访问二叉树的所有结点。
在遍历二叉树的过程中,一般先遍历左子树,然后再遍历右子树。 1、前序遍历(DLR)
所谓前序遍历是指在访问根结点、遍历左子树与遍历右子树这三者中,首先访问根结点,然后遍历左子树,最后遍历右子树;并且,在遍历左、右子树时,仍然先访问根结点,然后遍历左子树,最后遍历右子树。F,C,A,D,B,E,G,H,P 2、中序遍历(LDR)
所谓中序遍历是指在访问根结点、遍历左子树与遍历右子树这三者中,首先遍历左子树,然后访问根结点,最后遍历右子树;并且,在遍历左、右子树时,仍然先遍历左子树,然后访问根结点,最后遍历右子树。A,C,B,D,F,E,H,G,P 3、后序遍历(LRD)
所谓中序遍历是指在访问根结点、遍历左子树与遍历右子树这三者中,首先遍历左子树,然后遍历右子树,最后访问根结点;并且,在遍历左、右子树时,仍然先遍历左子树,然后遍历右子树,最后访问根结点。A,B,D,C,H,P,G,E,F 1.7查找技术 一、顺序查找
顺序查找又称顺序搜索。顺序查找一般是指在线性表中查找指定的元素,其基本方法如下:从线性表的第一个元素开始,依次将线性表中的元素与被查元素进行比较,若相等则表示找到(即查找成功);若线性表中所有的元素都与被查元素进行了比较但都不相等,则表示线性表中没有要找的元素(即查找失败)。 顺序查找的效率是很低的。以下两种情况只能采用顺序查找: 如果线性表无序表(即表中元素的排列是无序的),则不管是顺序存储结构还是链式存储结构,都只能用顺序查找。 即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。 二、二分法查找
二分法查找只适用于存储的有序表。在此所说的有序表是指线性表的中元素按值非递减排列(即从小到大,但允许相邻元素值相等)。
设有序线性表的长度为n,被查元素为x,则对分查找的方法如下: 将x与线性表的中间项进行比较:
若中间项的值等于x,则说明查到,查找结束;
若x小于中间项的值,则在线性表的前半部分(即中间项以前的部分)以相同的方法进行查找; 若x大于中间项的值,则在线性表的后半部分(即中间项以后的部分)以相同的方法进行查找。 这个过程一直进行到查找成功或子表长度为0(说明线性表中没有这个元素)为止。
显然,当有序线性表为顺序存储时才能采用二分查找,并且,二分查找的效率要比顺序查找高得多。可以证明,对于长度为n的有序线性表,在最坏情况下,二分查找只需要比较log2n次,而顺序查找需要比较n次。 1.8排序技术
一、交换类排队序法
所谓交换类排序法是指借助数据元素之间的互相交换进行排序的一种方法。冒泡排序法与快速排序法都属于交换类的排序方法。
1、 冒泡排序法 基本过程如下:
首先,从表头开始往后扫描线性表,在扫描过程中逐次比较相邻两个元素的大小。若相邻两个元素中,前面的元素大于后面的元素,则将它们互换,称之为消去了一个逆序。放最大值
然后,从后到前扫描剩下的线性表,同样,在扫描过程中逐次比较相邻两个元素的大小。若相邻两个元素中,后面的元素大于前面的元素,则将它们互换,这样就又消去了一个逆序。放最小值。 重复上述过程,直到剩下的线性有变空为止,此时的线性表已经变为有序。
假设线性表的长为n,则在最坏情况下,冒泡排序需要经过n/2遍的葱馨往后的扫描和n/2遍的从后往前的扫描,需要的比较
的次数为n(n-1)/2。 2、 快速排序法
快速排序法也是种互换类的排序法,但由于它比冒泡排序法的速度快,因此称之为快速排序法。 基本思想如下:
从线性表中选取一个元素,设T,将线性表后面小于T的元素移到前,而前大于T的元素移支后面,结果就将线性表分成了两部分(称为两个子表),T插入到其分界线的位置处,这个过程称为线性表的分割。通过对线性表的一次分割,就以T为分界线,将线性表分成了前后两个子表,且前面子表中的所有元素均不大于T,而后面子表中的所有元素均不小于T。 如此反复,则此时的线性表就变成了有序表。
步骤:首先,在表的第一个,中间一个与最后一个元素中选取中项,设为P(K),并将P(K)赋给T,再将表中的第一个元素移到P(K)的位置上。
然后设置两个指针i和j分别指向表的起始与最后的位置。反复操作以下两步:
(4) 将j逐渐减小,并逐次比较P(j)与T,直到发现一个P(j)
所谓插入排序,是指将无序序列中的各元素依次插入到已经有序的线性表中。
一般来说,假设线性中前j-1元素已经有序,现在要将线性表中第j个元素插入到前面的有序子表中,插入过程如下:
道德将第j个元素放到一个变量T中,然后从有序子表的最后一个元素(即线性表中第j-1个元素)开始,往前逐个与T进行比较,将大于T的元素均依次向后移动一个位置,直到发现一个元素不大于T为止,此时就将T(即原线性表中的第j个元素)插入到刚移出的空位置上,有序子表的长度就变为j了。效率与冒泡法相同 在最坏情况下,简单插入排序需要n(n-1)/2次比较。 2、 希尔排序法 基本思想如下:
将整个无序序列分割成若干小的子序列分别进行插入排序。 子序列的分割方法如下:
将相隔某个增量H的元素构成一个子序列。在排序过程中,逐次减小这个增量,最后当H减到1时,进行一次插入排序,排序就完成。增量序列一般取h=n/2k(k=1,2,…[log2n],其中n为待排序序列的长度。 其效率与增量序列有关。在最坏情况下,需要的比较次数为O(N1.5)。 三、 选择类排序法 1、 简单选择排序法
基本思想:扫描整个线性表,从中选出最小的元素,将它交换到表的最前面;然后对剩下的子表采用同样的方法,直到子表空为止。
简单选择排序法在最坏情况下需要比较n(n-1)/2/次。 2、 堆排序法 方法:(1)首先将一个无序序列建成堆。
(2)然后将堆顶元素(序列中的最大项)与堆中最后一个元素交换(最大项应该在序列的最后)。不考虑已经换到最后的那个元素,只考虑前n-1个元素构成的子序,显然,该子序列已不是堆,但左、右子树仍为堆,可以将该子序列调事为堆。反复做第(2)步,真到剩下的子序列为空为止。适用规模较大的线性表,在最坏情况下,堆排序需要比较的次数为O(nlog2n)。 1.7查找技术 一、顺序查找
顺序查找又称顺序搜索。顺序查找一般是指在线性表中查找指定的元素,其基本方法如下:从线性表的第一个元素开始,依次将线性表中的元素与被查元素进行比较,若相等则表示找到(即查找成功);若线性表中所有的元素都与被查元素进行了比较但都不相等,则表示线性表中没有要找的元素(即查找失败)。 顺序查找的效率是很低的。以下两种情况只能采用顺序查找: 如果线性表无序表(即表中元素的排列是无序的),则不管是顺序存储结构还是链式存储结构,都只能用顺序查找。 即使是有序线性表,如果采用链式存储结构,也只能用顺序查找。 二、二分法查找
二分法查找只适用于存储的有序表。在此所说的有序表是指线性表的中元素按值非递减排列(即从小到大,但允许相邻元素值相等)。
设有序线性表的长度为n,被查元素为x,则对分查找的方法如下:
将x与线性表的中间项进行比较:
若中间项的值等于x,则说明查到,查找结束;
若x小于中间项的值,则在线性表的前半部分(即中间项以前的部分)以相同的方法进行查找; 若x大于中间项的值,则在线性表的后半部分(即中间项以后的部分)以相同的方法进行查找。 这个过程一直进行到查找成功或子表长度为0(说明线性表中没有这个元素)为止。
显然,当有序线性表为顺序存储时才能采用二分查找,并且,二分查找的效率要比顺序查找高得多。可以证明,对于长度为n的有序线性表,在最坏情况下,二分查找只需要比较log2n次,而顺序查找需要比较n次。 1.8排序技术
一、交换类排队序法
所谓交换类排序法是指借助数据元素之间的互相交换进行排序的一种方法。冒泡排序法与快速排序法都属于交换类的排序方法。
1、 冒泡排序法 基本过程如下:
首先,从表头开始往后扫描线性表,在扫描过程中逐次比较相邻两个元素的大小。若相邻两个元素中,前面的元素大于后面的元素,则将它们互换,称之为消去了一个逆序。放最大值
然后,从后到前扫描剩下的线性表,同样,在扫描过程中逐次比较相邻两个元素的大小。若相邻两个元素中,后面的元素大于前面的元素,则将它们互换,这样就又消去了一个逆序。放最小值。 重复上述过程,直到剩下的线性有变空为止,此时的线性表已经变为有序。
假设线性表的长为n,则在最坏情况下,冒泡排序需要经过n/2遍的葱馨往后的扫描和n/2遍的从后往前的扫描,需要的比较的次数为n(n-1)/2。 2、 快速排序法
快速排序法也是种互换类的排序法,但由于它比冒泡排序法的速度快,因此称之为快速排序法。 基本思想如下:
从线性表中选取一个元素,设T,将线性表后面小于T的元素移到前,而前大于T的元素移支后面,结果就将线性表分成了两部分(称为两个子表),T插入到其分界线的位置处,这个过程称为线性表的分割。通过对线性表的一次分割,就以T为分界线,将线性表分成了前后两个子表,且前面子表中的所有元素均不大于T,而后面子表中的所有元素均不小于T。 如此反复,则此时的线性表就变成了有序表。
步骤:首先,在表的第一个,中间一个与最后一个元素中选取中项,设为P(K),并将P(K)赋给T,再将表中的第一个元素移到P(K)的位置上。
然后设置两个指针i和j分别指向表的起始与最后的位置。反复操作以下两步:
(4) 将j逐渐减小,并逐次比较P(j)与T,直到发现一个P(j)
所谓插入排序,是指将无序序列中的各元素依次插入到已经有序的线性表中。
一般来说,假设线性中前j-1元素已经有序,现在要将线性表中第j个元素插入到前面的有序子表中,插入过程如下:
道德将第j个元素放到一个变量T中,然后从有序子表的最后一个元素(即线性表中第j-1个元素)开始,往前逐个与T进行比较,将大于T的元素均依次向后移动一个位置,直到发现一个元素不大于T为止,此时就将T(即原线性表中的第j个元素)插入到刚移出的空位置上,有序子表的长度就变为j了。效率与冒泡法相同 在最坏情况下,简单插入排序需要n(n-1)/2次比较。 2、 希尔排序法 基本思想如下:
将整个无序序列分割成若干小的子序列分别进行插入排序。 子序列的分割方法如下:
将相隔某个增量H的元素构成一个子序列。在排序过程中,逐次减小这个增量,最后当H减到1时,进行一次插入排序,排序就完成。增量序列一般取h=n/2k(k=1,2,…[log2n],其中n为待排序序列的长度。 其效率与增量序列有关。在最坏情况下,需要的比较次数为O(N1.5)。 三、 选择类排序法 1、 简单选择排序法
基本思想:扫描整个线性表,从中选出最小的元素,将它交换到表的最前面;然后对剩下的子表采用同样的方法,直到子表
空为止。
简单选择排序法在最坏情况下需要比较n(n-1)/2/次。 2、 堆排序法 方法:(1)首先将一个无序序列建成堆。
(2)然后将堆顶元素(序列中的最大项)与堆中最后一个元素交换(最大项应该在序列的最后)。不考虑已经换到最后的那个元素,只考虑前n-1个元素构成的子序,显然,该子序列已不是堆,但左、右子树仍为堆,可以将该子序列调事为堆。反复做第(2)步,真到剩下的子序列为空为止。适用规模较大的线性表,在最坏情况下,堆排序需要比较的次数为O(nlog2n)。 习题一 一、选择题
1、算法的时间复杂度是指( )
A)执行算法程序所需要的时间 B)算法程序的长度
C)算法执行过程中所需要的基本运算次数 D)算法程序中的指令条数 2、算法的窨复杂度是指( )
A、算法程序的长度 B、算法程序中的指令条数
C、算法程序所占的存储空间 D、算法执行过程中所需要的存储空间 3、下列叙述中正确的是( )
A、线性表是线性结构 B、材与队列是非线性结构 C、线性链表是非线性结构 D、二叉树是线性结构 4、数据的存储结构是指( )
A、数据所占的存储空间量 B、数据的逻辑结构在计算机中的表示 C、数据在计算机中的顺序存储方式 D、存储在外存中的数据 5、下列关于队列的叙述中正确的是( )
A、在队列中只能插入数据 B、在队列中只能删除数据 C、队列是先进先出的线性表 D、队列是先进后出的线性表 6、下列关于栈的叙述中正确的是( )
A、在栈中只能插入数据 B、在栈中只能删除数据 C、栈是先进先出的线性表 D、栈是先进后出的线性表 7、设有下列二叉树:
对此二叉树中序遍历的结果为
A、ABCDEF B、DBEAFC C、ABDECF D、DEBFCA 8、在深度为5的满二叉树中,叶子结点的个数为( )
A、32 B、31 C、16 D、15 9、对长度为 n的线性表进行顺序查找,在最坏情况下所需要的比较次数为( ) A、 n+1 B、n C、(n+1)/2 D、n/2
10、设树T的度为4,其中度为1,2,3,4的结点个数分别为4,2,1,1。则T中的叶子结点数为( ) A、8 B、7 C、6 D、5 二、填空题
1、在长度为n 的有序线性表中进行二分查找,需要的比较次数为 。 2、设一棵完全二叉共有700个结点,则在该二叉树中有 个叶子结点。
3、设一棵二叉树中序遍历结果为DBEAFC ,前序遍历结果为ABDECF,则后序遍历结果为 。 4、在最坏情况下,冒泡排序的时间复杂度为 。
5、在一个容量为15的循环队列中,若头指针front=6,尾指针rear=9,则该循环队列中共有 个元
第2章 程序设计基础 2.1 程序设计方法与风格
就程序设计方法和技术的发展而言,主要经过了结构化程序设计和面向对象的程序设计阶段。
一般来讲。程序设计风格是指编写程序时所表现出的特点、习惯和逻辑思路。程序是由人来编写的,为了测试和维护程序,往往还要新闻记者和跟踪程序,因此程序设计的风格总体而言应该强调得意和清晰,程序必须是可以理解的。 要形成良好的程序设计风格,主要应注重和考虑下述一些因素。 1、 源程序文档化
2、 源程序文档化应考虑如下几点:
(1) 符号名的命名:符号名的命名应具有一定的实际含义,以便于对程序功能的理解。
(2) 程序注释:下克的注释能够帮助读者理解程序。
(3) 礼堂组织:为使程序的结构一目了然,可以在程序中利用空格、空行、缩进待技巧使程序层次清晰。 2、数据说明的方法
在编写程序时,需要注意数据说明的风格,以便使程序中的数据说明更易于理解和维护。一般应注意如下几点:
(1) 数据说明的次序规范化鉴于程序理解、新闻记者和维护的需要,使数据说明次序固定,可以使数据的发生容易查找,也有利于测试、排错和维护。
(2) 说明语句中变量安排有序化。当一个说明语句说明多个变量时,变量按照字母顺序为好。 (3) 使用注释来说明复杂数据的结构。 3、 语句的结构
程序应该简单易懂,语句构造应该简单直接,不应该为提高效率而把语句复杂化。一般应注意如下: (1) 在一行内只写一条语句; (2) 程序编写应优先考虑清晰性;
(3) 除非对效率有特殊要求,程序编写要做清晰第一,效率第二; (4) 首先要保证程序正确,然后才要求提高速度; (5) 避免使用临时变量而使程序的可读性下降; (6) 避免不必要的转移; (7) 尽可能使用库函数;
(8) 避免采用复杂的条件语句;
(9) 尽量减少使用“否定”条件的条件语句; (10) 数据结构要有利于程序的简化;
(11) 要模块化,使模块功能尽可能单一化;
(12) 利用住处隐蔽,确保每一个模块的独立性; (13) 从数据出发去构造程序;
(14) 不要修补不好的程序,要重新编写; 4、输入和输出
无论是批处理的输入和输出方式,还是交互式的输入和输出方式,在设计和编程时都应该考虑如下原则: (1) 对所有的输入数据都要检验数据的合法性; (2) 检查输入项的各种重要组合的合理性;
(3) 输入格式要简单,以使得输入的步骤和操作尽可能简单; (4) 输入数据时,应允许使用自由格式; (5) 应允许缺省值;
(6) 输入一批数据时,最好使用输入结束标志;
(7) 在以交互式输入/输出方式进行输入时,要在屏幕上使用提示符明确提示输入的请求,同时在数据输入过程中的输入结束时,应在屏幕上给出状态信息。
(8) 当程序设计语言对输入格式有严格要求时,应保持输入格式与输入语句的一致性;给所有的输入出加注释,并设计输出报表格式。 2.2结构化程序设计
一、结构化程序设计的原则
结构化程序设计方法的主要原则可以概括为自顶向下,逐步求精,模块化,限制使用goto语句。
1、 自顶向下:程序设计时,应先考虑总体,后考虑细节;先考虑全局目标,后考虑局部目标。不要一开始就过多追求众多的细节,先从最上层总目标开始设计,逐步使问题具体化。
2、 逐步求精:对复杂问题,应设计一些子目标作过渡,逐步细化。
3、 模块化:一个复杂问题,肯定是由若干稍简单的问题构成。模块化是把程序要解决的总目标分解为分目标,再进一步分解为具体的小目标,把每个小目标称为一个模块。 4、 限制使用goto语句 使用goto语句经实验证实:(1)滥用GOTO语句确实有害,应昼避免;
(2)完全避免使用GOTO语句也并非是个明智的方法,有些地方使用GOTO语句,会使程序流程更清楚、效率更高; (3)争论的焦点不应该放在是否取消GOTO语句,而应该放在用什么样的程序结构上。 其中最关键的是,肯定以提高程序清晰性为目标的结构化方法。 二、结构化程序的基本结构与特点
1、顺序结构:顺序结构是简单的程序设计,它是最基本、最常用的结构,所谓顺序执行,就是按照程序语句行的自然顺序,一条语句一条语句地执行程序程序。
2、选择结构:选择结构又称为分支结构,它包括简单选择和多分支选择结构,这种结构可以根据设定的条件,判断应该选择哪一条分支来执行相应的语句序列。
3、重复结构:重复结构又称为循环结构,它根据给定的条件,判断是否需要重复执行某一相同的或类似的程序段,利用重复结构可简化大量的程序行。分为两类:一是先判断后执行,一是先执行后判断。 优点:一是程序易于理解、使用和维护。二是编程工作的效率,降低软件开发成本。 三、结构化程序设计原则和方法的应用 要注意把握如下要素:
1、 使用程序设计语言中的顺序、选择、循环等有限的控制结构表示程序的控制逻辑。 2、 选用的控制结构只准许有一个入口和一个出口;
3、 程序语句组成容易识别的块,每块只有一个入口和一个出口; 4、 复杂结构应该嵌套的基本控制结构进行组合嵌套来实现; 5、 语言中所没有的控制结构,应该采用前后一致的方法来模拟; 6、 严格控制GOTO语句的使用。其意思是指:
(1) 用一个非结构化的程序设计语言去实现一个结构化的构造; (2) 若不使用GOTO语句会使功能模糊;
(3) 在某种可以改善而不损害程序可读性的情况下。 2.3面向对象的程序设计 一、关于面向对象方法
面向对象方法的本质,就是主张从客观世界固有的事物出发来构造系统,提倡用人类在现实生活中常用的思维方法来认识、理解和描述客观事物,强调最终建立的系统能够映射问题域,也就是说,系统中的对象以及对象之间的关系能够如实地反映问题域中固有事物及其关系。
优点:1、与人类习惯的思维方法一致
面向对象方法和技术以对象为核心。对象是由数据和容许的操作组成的封装体,与客观实体有直接的关系。对象之间通过传递消息互相联系,以模拟现实世界中不同事物彼此之间的联系。
面向对象的设计方法与传统的面向过程的方法有本质不同,这种方法的基本原理是:使用现实世界的概念抽象地思考问题从而自然地解决问题。它强调模拟现实世界中的概念而不强调算法,它鼓励开发者在软件开发的绝大部分过程中都用应用领域的要领去思考。 2、稳定性好 3、可重用性好
软件重用是指在不同的软件开发过程中重复作用相同或相似软件元素的过程。重用是提高软件生产率的最主要的方法。 4、易于开发大型软件产品 5、可维护性好
(1)用面向对象的方法开发的软件稳定性比较好 (2)用面向对象的方法开发的软件比较容易修改; (3)用面向对象的方法开发的软件比较容易理解。 (4)易于测试和调试。
二、面向对象方法的基本概念 1、对象(object)
对象是面向对象方法中最基本的概念。对象可以用来表示客观世界中的任何实体,也就是说,应用领域中有意义的、与所要解决的问题有关系的任何事物都可以作为对象,它既可以是具体的物理实体的抽象,也可以是人为的概念,或者是任何有明确边界的意义的东西。总之,对象是对问题域中某个实体的抽象,设立某个对象就反映软件系统保存有关它的信息并具有与它进行交互的能力。
面向对象的程序设计方法中涉及的对象是系统中用来描述客观事物的一个实体,是构成系统的一个基本单位,它由一组表示其静态特征的属性和它可执行的一组操作组成。
对象可以做的操作表示它的动态行为,在面向对象分析和面向对象设计中,通常把对象的操作也称为方法或服务。 属性即对象所包含的信息,它在设计对象时确定,一般只能通过挂靠对象的操作来改变。
操作描述了对象执行的功能,若通过消息传递,还可以为其他对象使用。操作的过程对外是封闭的,即用户只能看到这一操作实施后的结果。这相当于事先已经设计好的各种过程,只需要调用就可以了,用户不必去关心这一过程是如何编写的。事实上,这个过程已经封装在对象中,用户也看不到。对的这一特性即是对象的封装性。 对象有如下一些基本特点:
(1) 标识惟一性。指对象是可区分的,并且由对象有的内在本质来区分,而不是通过描述来区分。 (2) 分类性。指可以将具有相同属性的操作的对象抽象成类。
(3) 多太性。指同一个操作可以是不同对象的行为。
(4) 封装性。从外面看只能看到对象的外部特性,即只需知道数据的取值范围和可以对该数据施加的操作,根本无需知道数据的具体结构以及实现操作的算法。对象的内部,即处理能力的实行和内部状态,对外是不可见的。从外面不能直接使用对象的处理能力,也不能直接修改其内部状态,对象的内部状态只能由其自身改变。
(5) 模块独立性好。对象是面向对象的软件的基本模块,它是由数据及可以对这些数据施加的操作所组成的统一体,而且对象是以数据为中心的,操作围绕对其数据所需做的处理来设置,没有无关的操作从模块的独立性考虑,对象内部各种元素彼此结合得很紧密,内聚性强。 2、类(Class)和实例(Instance)
将属性、操作相似的对象归为类,也就是说,类是具有共同属性、共同方法的对象的集合。所以,类是对象的抽象,它描述了属于该对象类型的所有对象的性质,而一个对象则是其对应类的一个实例。
要注意的是,当使用“对象”这个术语时,既可以指一个具体的对象,也可以泛指一般的对象,但是,当使用“实例”这个术语时,必然是指一个具体的对象。 例如:Integer是一个整数类,它描述了所有整数的性质。因此任何整数都是整数类的对象,而一个具体的整数“123”是类Integer的实例。
由类的定义可知,类是关于对象性质的描述,它同对象一样,包括一组数据属性和在数据上的一组合法操作。 3、消息(Message)
面向对象的世界是通过对象与对象间彼此的相互合作来推动的,对象间的这种相互合作需要一个机制协助进行,这样的机制称为“消息”。消息是一个实例与另一个实例之间传递信息,它请示对象执行某一处理或回答某一要求的信息,它统一了数据流的控制流。消息的使用类似于函数调用,消息中指定了某一个实例,一个操作名和一个参数表(可空)。接收消息的实例执行消息中指定的操作,并将形式参数数与参数表中相应的值结合起来。消息传递过程中,由发送消息的对象(发送对象)的触发操作产生输出结果,作为消息传送至接受消息的对象(接受对象),引发接受消息的对象一系列的操作。所传送的消息实质上是接受对象所具有的操作/方法名称,有时还包括相应参数。
消息中只包含传递者的要求,它告诉接受者需要做哪些处理,但并不指示接受者应该怎样完成这些处理。消息完全由接受者解释,接受者独立决定采用什么方式完成所需的处理,发送者对接受者不起任何控制作用。一个对象能够接受不同形式、不同内容的多个消息;相同形式的消息可以送往不同的对象,不同的对象对于形式相同的消息可以有不同的解释,能够做出不同的反映。一个对象可以同时往多个对象传递信息,两个对象也可以同时向某个对象传递消息。 例如,一个汽车对象具有“行驶”这项操作,那么要让汽车以时速50公里行驶的话,需传递给汽车对象“行驶”及“时速50公里”的消息。
通常,一个消息由下述三部分组成: (1) 接收消息的对象的名称; (2) 消息标识符(也称为消息名); (3) 零个或多个参数。 4、 继承(Inheritance)
继承是面向对象的方法的一个主要特征。继承是使用己有的类定义作为基础建立新类的定义技术。已有的类可当作基类来引用,则新类相应地可当作派生类来引用。
广义地说,继承是指能够直接获得已有的性质和特征,而不必重复定义它们。
面向对象软件技术的许多强有力的功能和突出的优点,都来源于把类组成一个层次结构的系统:一个类的上层可以有父类,下层可以有子类。这种层次结构系统的一个重要性质是继承性,一个类直接继承其父类的描述(数据和操作)或特性,子类自动地共享基类中定义的数据和方法。 继承具有传递性,如果类C继承类B,类B继承类A,则类C继承类A。因此一个类实际上继承了它上层的全部基类的特性,也就是说,属于某类的对象除了具有该类所定义的特性外,还具有该类上层全部基类定义的特性。
继承分为单继承与多重继承。单继承是指,一个类只允许有一个父类,即类等级为树形结构。多重继承是指,一个类允许有多个父类。多重继承的类可以组合多个父类的性质构成所需要的性质。因此,功能更强,使用更方便;便是,使用多重继承时要注意避免二义性。继承性的优点是,相似的对象可以共享程序代码和数据结构,从而大大减少了程序中的冗余信息,提高软件的可重用性,便于软件个性维护。此外,继承性便利用户在开发新的应用系统时不必完全从零开始,可以继承原有的相似系统的功能或者从类库中选取需要的类,再派生出新的类以实现所需要的功能。 5、 多太性(Polymorphism)
对象根据所接受 的消息而做出动作,同样的消息被不同的对象接受时可导致完全不同的行动,该现象称为多态性。在面向对象的软件技术中,多态性是指类对象可以像父类对象那样使用,同样的消息既可以发送给父类对象也可以发送给子类对象。 多态性机制不仅增加了面向对象软件系统的灵活性,进一步减少了信息冗余,而且显著地提高了软件的可重用性和可扩充性。当扩充系统功能增加新的实体类型时,只需派生出与新实体类相应的新的子类,完全无需修改原有的程序代码,甚至不需要重新编译原有的程序。利用多态性,用户能够发送一般形式的消息,而将所有的实现细节都留给接受消息的对象。
第3章 软件工程基础 3.1软件工程基本概念 一、软件定义与软件特点
计算机软件是计算机系统中与硬件相互依存的另一部分,是包括程序、数据及相关文档的完整集合。基中,程序是软件开发人员根据用户需求开发的用程序设计语言描述的、适合计算机执行的指令(语句)序列。数据是使程序能正常操纵信息的数据结构。文档是与程序开发、
维护和使用有关的图文资料。可见软件由两部分组成:一是机器可执行的程序和数据;二是机器不可执行的,与软件开发、运行、维护、使用等有关的文档。
国标(GB)中对计算机软件的定义为:与计算机系统的操作有关的计算机程序、规程、规则,以及可能有的文件、文档及数据。
软件在开发、生产、维护和使用等方面与计算机硬件相比存在明显的差异。深入理解软件的定义需要了解软件的特点: (1) 软件是一种逻辑实体,而不是物理实体具有抽象性。
(2) 软件的生产与硬件不同,它没有明显的制作过程。一旦研制开发成功,可以大量拷贝同一内容的副本。所以对软件的控制,必须着重在软件开发方面下功夫。
(3) 软件在运行、使用期间不存在磨损、老化问题。
(4) 软件的开发运行对计算机系统具有依赖性,受计算机系统的限制这导致了软件移植的问题。 (5) 软件复杂性高,成本昂贵。 (6) 软件开发涉及诸多的社会因素。
软件按功能可以分为:应用软件、系统软件、支撑软件(或工具软件)。应用软件是为解决特定领域的应用而开发的软件。系统软件是计算机管理自身资源,提高计算机使用效率并为计算机用户提供各种服务的软件。支撑软件是介于系统软件和应用软件之间,协助用户开发软件的工具性软件,包括辅助和支持开发和维护应用软件的工具软件。 二、软件危机与软件工程
软件工程概念的出现源自软件危机。
所谓有软件危机四伏是泛指在计算机软件开发和维护过程中所遇到的严重问题。实际上,几科所有的软件都不同程度地存在这些问题。
随着计算机技术的发展和应用领域的扩大,计算机硬件性能/价格比和质量稳步提高,软件规模越来越大,复杂程度不断增加,软件成本逐年上升,质量没有可靠的保证,软件已成为计算机科学发展的“瓶颈”。 具体地说,在软件开发和维护过程中,软件危机主要表现在:
(1) 软件需求的增长得不到满足。用户对系统不满意的情况经常发生。
(2) 软件开发成本和进度无法控制。开发成本超出预算,开发周期大大超过规定日期的情况经常发生。 (3) 软件质量难以保证。
(4) 软件不可维护或护程度非常低。 (5) 软件的成本不断提高。
(6) 软件开发生产率的提高赶不上硬件的发展和应用需求的增长。 总之,可以将软件危机归结为成本、质量、生产率等问题。
软件工程就是试图用工程、科学和数学的大批量与方法研制、维护计算机软件的有关技术及管理方法。
关于软件工程的定义,国标(GB)中指出,软件工程是应用于计算机软件的定义、开发和维护的一整套方法、工具文档、实践标准的工序。
1993年IEEE(Institute of Electrical &Electronic Engineers ,电气和电子工程师学会)给出了一个更加综合的定义:“将系统化的、规范的、可度量的方法应用于软件的开发、运行和维护的过程,即将工程化应用于软件中”。
软件工程包括3个要素:即方法、工具和过程。方法是完成软件工程项目的技术手段;工具支持软件的开发、管理、文档生成;过程支持软件开发的各个环节的控制、管理。
软件工程的核心思想是把软件产品看作是一个工程产品来处理。
开发软件不能只考虑开发期间的费用,而且应考虑软件生命周期内的全部费用。因此,软件生命周期的概念就变得特别重要。在考虑软件费用时,不仅仅要降低开发成本,更要降低整个软件生命周期的总成本。 三、软件工程过程与软件生命周期
1、软件工程过程(Software Engineering Process)
ISO9000定义:软件工程过程是把输入转化为输出的一组彼此相关的资源和活动。
定义支持了软件工程过程的两方面内涵。其一,软件工程过程是指为获得软件产品,在软件工具支持下由软件工程师完成的一系列软件工程活动。基于这个方面,软件工程过程通常包含4种基本活动: (1) P(plan)——软件规格说明。规定软件的功能及其运行时的限制。
(2) D(do)——软件开发。产生满足规格说明的软件。
(3) C(check)——软件确认。确认软件能够满足客户提出的要求。
(4) A (action)——软件演进。为满足客户的变更要求,软件必须在使用的过程中演进。
通常把用户的要求转变成软件产品的过程也叫做软件开发过程。此过程包括对用户的要求进行分析,解释成软件需求,把需求变换成设计,把设计用代码来实现并进行代码测试,有些软件还需要进行代码安装和交付运行。 其二,从软件开发的观点看,它就是使用适当的资源(包括人员、硬软件工具、时间等),为开发软件进行的一组开发活动,在过程结束时将输入(用户要求)转化为输出(软件产品)。
所以,软件工程的过程是将软件工程的方法和工具综合起来,以达到合理、及时地进行计算机软件开发的目的。软件工程过程应确定方法使用的顺序、要求交付的文档资料、为保证质量和适应变化所需要的管理、软件开发各个阶段完成的任务。 2、软件生命周期(software life cycle)
通常,将软件产品从提出、实现、使用维护到停止使用退役的过程称为软件生命周期。一般包括可行性研究与需求分析、设计、实现、测试、交付使用以及维护等活动。
还可以将软件生命周期分为软件定义、软件开发及软件运行维护三个阶段。软件生命周期的主要活动阶段是:
(1) 可行性研究与计划制定。确定待开发软件系统的开发目标和总的要求,给出它的功能、性能、可靠性以及接口等方面的可能方案,制定完成开发任务的实施计划。
(2) 需求分析。对待开发软件提出的需求进行分析并给出详细定义。编写软件规格说明书及初步的用户手册,提交评审。
(3) 软件设计。系统设计人员和程序设计人员应该在反复理解软件需求的基础上,给出软件的结构、模块和划分、功能的分配及处理流程。在系统比软件复杂的情况下,设计阶段可分解成概要设计阶段和详细设计阶段。编写概要设计说明书、详细设计说明书和测试计划初稿,提交评审。
(4) 软件实现。把软件设计转换成计算机可以接受的程序代码。即完成源程序的编码,编写用户手册、操作手册等面向用户的文档,编写单元测试计划。
(5) 软件测试。在设计测试用例的基础上,检验软件的各个组成部分。编写测试分析报告。
(6) 运行和维护。将已交付的软件投入运行,并在运行使用中不断地维护,根据新进出的需求进行必要而且可能的扩充和删改。
四、软件工程的目标与原则 1、软件工程的目标
软件工程的目标是,在给定成本、进度的前提下,开发出具有有效性、可靠性、可理解性、可维护性、可重用性、可适应性、可移植性、可追踪性和可互操作性且满足用户需求的产品。
软件工程需要达到的基本目标应是:付出较低的开发成本;达到要求的软件功能;取得较好的软件性能;开发的软件易于移植;需要较低的维护费用;能按时完成开发,及时交付使用。
基于软件工程的目标,软件工程的理论和技术性研究的内容主要包括:软件开发技术和软件工程管理。 (1) 软件开发技术
软件开发技术包括:软件开发法学、开发过程、开发工具和软件工程环境,其主体内容是软件开发方法学。软件开发方法学是根据不同的软件类型,按不同的观点和原则,对软件开发中应遵循的策略、原则、步骤和必须产生的文档资料都做出规定,从而使软件的开发能够进入规范化和工程化的阶段,以克服早期的手工方法生产中的随意性和非规范性做法。 (2) 软件工程管理
软件工程管理包括:软件管理学、软件工程经济学、软件心理学等内容。
软件工程管理是软件按工程化生产时的重要环节,它要求按照预选制定的计划、进度和预算执行,以实现预期的经济效益和社会效益。
软件工程经济学是研究软件开发中成本的估算、成本效益分析的方法和技术,用经济学的基本原理来研究软件工程开发中的经济效益问题。
软件心理学是软件工程领域具有挑战性的一个全新的研究视角,它是从个体心理、人类行为、组织行为和企业文化等角度来研究软件管理和软件工程的。 2、软件工程的原则
为了达到上述的软件工程目标,在软件开发过程中,必须遵循软件工程的基本原则。这些基本原则包括抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性和可验证性。
(1) 抽象。抽取事物最基本的特性和行为,忽略非本质细节。采用分层次抽象,自顶向下,逐层细化的办法控制软件开发过程的复杂性。
(2) 信息隐蔽。采用封闭技术,将程序模块的实现细节隐藏起来,使模块接口尽量简单。
(3) 模块化。模块是程序中相对独立的成分,一个独立的编程单位,应有良好的接口定义。模块的大小要适中,模块过大会使模块内部的复杂性增加,不得对模块的理解和个性也不得模块的调试和重用。模块太小会导致整个系统表示过
于复杂,不利于控制系统的复杂性。
(4) 局部化。要求在一个物理模块内集中逻辑上相互关联的计算资源,保证模块间具有松散的耦合关系,模块内部有较强的内骤性,这有助于控制角的复杂性。
(5) 确定性软件开发过程中所有概念的表达应是确定的、无歧义且规范的。这有助于人与人的交互不会产生误解和遗漏,以保证整个开发工作的协调一致。
(6) 一致性。扬程序、数据和文档的整个软件系统的各模块应使用已知的概念、符号和术语;程序内外部接口应保持一致,系统规格说明与系统行为应保持一致。
(7) 完备性。软件系统不丢失任何重要成分,完全实现系统所需的功能。
(8) 可验证性。开发大型软件系统需要对系统自顶向下,逐层分解。系统分解应遵循容易检查、测评、评审的原则,以确保系统的正确性。
五、软件开发工具与软件开发环境
现代软件工程方法之所以千里马实施,其重要的保证是软件开发工具的环境的保证,使软件在开发效率、工程质量等多方面得到改善。软件工程鼓励研制和采用各种先进的软件开发方法、工具和环境。工具和环境的使用进一步提高了软件的开发效率、维护效率和软件质量。 1、 软件开发工具 2、 软件开发环境
软件开发环境或称软件工程环境是全面支持软件开发全过程的软件工具集合。
计算机辅助软件工程(CASE,computer aided software engineering)是当前软件开发环境中富有特色的研究工作和发展方向。CASE将各种软件工具、开发机器和一个慧放开发过程信息的中心数据库组合起来,形成软件工程环境。CAS3E的成功产品将最大限度地降低软件开发的技术难度并使软件开发的质量得到保证。
3.2结构化分析方法
软件开发方法是软件开发过程所遵循的方法和步骤,其目的在于有效地得到一些工作产品,即程序和文档,并且满足质量要求。软件开发方法包括分析方法、设计方法和程序设计方法。 一、 需求分析与需求分析方法 1、 需求分析
软件需求是指用户对目标软件系统在功能、行为、性能、设计约束等方面的期望。需求分析的任务是发现需求、求精、建模和定义需求的过程。需求分析将创建所需的数据模型、功能模型和控制模型。 (1)需求分析的定义
A、用户解决问题或达到目标所需的条件或权能;
B、系统或系统部件要满足合同、标准、规范或其他正式规定文档所需具有的条件或权能; C、一种所映A、或B所描述的条件或权能的文档说明。
由需求体魄 定义可知,需求分析的内容包括:提炼、分析和仔细审查已收集到的需求;确保所有利益相关者都明白其含义并找出其中的错误、遗漏或其他不足的地方;从用户最初的非形式化需求到满足用户对软件产品的要求的映射;对用户意图不断进行提示和判断。 (2)需求分析阶段的工作
需求分析阶段的工作,可以概括为四个方面:
A、 需求获取 需求获取的目的是确定对目标系统的各方面需求。涉及到的主要任务是建立获取用户需求的方法框架,并支持和监控需求获取的过程。
B、 需求分析 对获取的需求进行分析和综合,最终给出系统的解决方案和目标系统的逻辑模型。
C、 编写需求规格说明书 需求规格说明书作为需求分析的阶段成果,可以为用户、分析人员和设计人员之间的交流提供方便,可以直接支持目标软件系统的确认又可以作为控制软件开发进程的依据。
D、 需求评审 在需求分析 的最后一步,对需求分析阶段的工作进行得审,验证需求文档的一致性、可行性、完整性和有效性。
2、 需求分析方法 常见的需求分析方法有:
A、 结构化分析方法。主要包括:面向数据流的结构化分析方法(SA—Structured analysis),面向数据结构的Jackson方法(JSD—Jackson system development method),面向数据结构的结构化数据系统开发方法(DSSD—Data structured system development method)。
B、 面向对象的分析方法(OOA—Object-Oriented method)。
从需求分析建立的模型的特性来分,需求分析方法又分为表态分析方法和动态分析方法。 二、 结构化分析方法
1、 关于结构化分析方法
结构化分析方法是结构化程序设计理论在软件需求分析阶段的运用。
对于面向数据流的结构化分析方法,按照DeMarco的定义,“结构化分析就是使用数据流图(DFD)、数据字典(DD)、结构化英语、判定表和羊定树等工具,来建立一种新的、称为结构化规格说明的目标文档。”
结构化分析方法的实质是着眼于数据流自顶向下,逐层分解,建立系统的处理流程,以数据流图和数据字典为主要工具建立系统的逻辑模型。
结构化分析的步骤如下:
A、 通过对用户的调查,以软件的需求为线索,获得当前系统的具体模型; B、 去掉具体模型中非本质因素,抽象出当前系统的逻辑模型;
C、 根据计算机的特点分析当前系统与目标系统的差别,建立目标系统的逻辑模型; D、 完善目标系统并补充细节,写出目标系统的软件需求规格说明; E、 评审直到确认完全符合用户对软件的需求。 2、 结构化分析的常用工具
(1) 数据流图(DFD—Data Flow Diagram)
数据流图是描述数据处理过程的工具,是需求理解的逻辑模型的图形表示,它直接支持系统的功能建模。
数据流图从数据传递和加工的角度,来刻画数据流从输入到输出的移动变换过程。数据流图中的主要图形元素与说明如下: 加工(转换)。输入数据经加工变换产生输出。
数据流沿箭头方向传送数据的通道,一般在旁边标注数据流名。 存储文件(数据源)。表示处理过程中存放各种数据的文件。 源,潭。表示系统和环境的接口,属系统之外的实体。
一般通过对实际系统的了解和分析后,使用数据流图为系统建立逻辑模型。建立数据流图的步骤如下: 第1步:由外向里:先画系统的输入输出,然后画系统的内部。 第2步:自顶向下:顺序完成顶层、中间层、底层数据流图。 第3步:逐层分解。
为保证构造的数据流图表达完整、准确、规范,应遵循以下数据流图的构造规则和注意事项: ① 对加工处理建立惟一、层次性的编号,且每个加工处理通常要求既有输入又有输出; ② 数据存储之间不应该有数据流; ③ 数据流图的一致性。 ④ 父图、子图关系与平衡规则。 (2)数据字典(DD—Data Dictionary)
数据字典是结构化分析方法的核心。数据字典是对所有与系统相关的数据元素的一个有组织的列表,以及精确的、严格的定义,使得用户和系统分析员对于输入、输出、存储成分和中间计算结果有共同的理解。数据字典把不同的需求文档和分析模型紧密地结合在一起,与各模型的图形表示配合,能清楚地表达数据处理的要求。
概括地说,数据字典的作用是对DFD中出现的被命名的图形元素的确切解释。通常数据字典饮食的信息有:名称,别名、何处作用/如何使用、内容描述、补充信息等。 (3) 判定树
使用判定树进行描述时,应先从问题定义的文字描述中分清哪些是判定的条件,哪些是判定的结论,根据模仿材料中的连接词找出判定条件之间的从属关系、并列关系、选择关系,根据它们构造判定树。 (4) 判定表
判定表与判定树相似,当数据流图中的加工要依赖于多个逻辑条件的联欢会,即完成该加工的一组动作是由于某一组条件联欢会的组合而引发的,使用判定表描述比较适宜。判定表由四部分组成,基本条件,条件项,基本动作,动作项 三、 软件需求规格说明书
软件需求规格说明书(SRS, software Requirement Specification) 是需求分析阶段的最后成果,是软件开发中的文档之一。 1、 软件需求规格说明书的作用 ① 便于用户、开发人员进行理解和交流。 ② 反映出用户问题的结构,可以作为软件开发工作的基础和依据。 ③ 作为确认测试的验收的依据。 2、 软件需求规格说明书的内容 一、 概述
二、 数据描述 ? 数据流图 ? 数据字典
? 系统接口说明 ? 内部接口 三、 功能描述 ? 功能 ? 处理说明 ? 设计的限制 四、 性能描述 ? 性能参数 ? 测试种类
? 预期的软件响应 ? 应考虎的特殊问题 五、 参考文献目录 六、 附录
其中,概述是从系统的角度描述软件的目标和任务。 数据描述是对软件系统所必须解决的总是作出的详细说明
功能描述中描述了为解决用户问题所需要的每一项功能的过程细节。对每一项功能要给出处理说明和在设计时需要考虑的限制条件。
在性能描述中说明系统应达到的性能和应该满足的限制条件,检测的方法和标准,预期的软件响应和可能需要考虑的特殊问题。
参考文献目录中应包括与该软件有关全部参考文献,其中包括前期的其他文档、技术参考资料、产品目录手册以及标准等。 附录部分包括一些补充资料。 3、软件需求规格说明书的特点 ① 软件需求规格说明书是确保软件质量的有力措施,衡量软件需求规格说明书质量好坏的标准、标准的优先级及标准的内涵是: ② 正确性。体现待开发系统的真实要求。 ③ 无歧义性。对每一个需求只有一种解释,其陈述具有惟一性。 ④ 完整性。包括全部有意义的需求,功能的、性能的、设计的、约束的,属性或外部接口等方面的需求。 ⑤可验证性。描述的每一个需求都是可以验证的,即存在有限代价的有效过程验证确认。 ⑥ 一致性。各个需求的描述矛盾。 ⑦ 可理解性。需求说明书必须简明易懂,尽量少包含计算机的要领和术语,以便用户和软件人员都能接受它。 ⑧可修改性。每一个需求的来源、流向是清晰的,当产生和改变文件编制时,可以方便地引证每一个需求。 3.3 结构化设计方法
一、 软件设计的基本概念 1、 软件设计的基础
软件设计是软件工程的重要阶段,是一个把软件需求转换为软件表示的过程。软件设计的基本目标是用比较抽象概括的方式确定目标系统如何完成预定的任务,即软件设计是确定系统的物理模型。 软件设计的重要性和地位概括为以下几点: ① 软件开发阶段(设计、编码、测试)占据软件项目开发总成本绝大部分,是在软件开发中形成质量的关键五一节; ② 软件设计是开发阶段最重要的步骤,是将需求准确地转化为完整的软件产品或系统的惟一途径; ③ 软件设计作出的决策,最终影响软件实现的成败; ④ 设计是软件工程和软件维护的基础。
从技术观点来看,软件设计包括软件结构设计、数据设计、接口设计、过程设计。其中,结构设计是定义软件系统各主要部件之间的关系;数据设计是将分析时创建的模型转化为数据结构的定义;接口设计是描述软件内部、软件和协作系统之间以及软件与人之间如何通信;过程设计则是把系统结构部件转换成软件的过程性描述。
从工程管理角度来看,软件设计分两步完成:概要设计和详细设计。概要设计(又称结构设计)将软件需求转化为软件体系结构、确定系统级接口、全局数据结构或数据库模式;详细设计确立每个模块的实现算法和局部数据结构,用适当方法表示算法和数据结构的细节。
软件设计的一般过程是:软件设计是一个迭代的过程;先进行高层次的结构设计;后进行低层次的过程设计;穿插进行数据设计和接口设计。
2、 软件设计的基本原理
软件设计遵循软件工程的基本目标和原则,建立了适用于在软件设计中应该遵循的基本原理和与软件设计有关的概念。 (1)抽象
抽象是一种思维工具,就是把事物本质的共同特性提取出来而不考虑其他细节。软件设计中考虑模块化解决方案时,可以定出多个抽象级别。抽象的层次从概要设计到详细设计逐步聊低。在软件概要设计中的模块分层也是由抽象到具体逐步分析和构造出来的。 (2)模块化
模块化是指把一个待开发的软件分解成若干个小的简单的部分。如高级语言中的过程、函数、子程序等。每个模块可以完成一个特定的子功能,各个模块可以按一定的方法组装起来成为一个整体,从而实现整个系统的功能。 模块化是指解决一个复杂问题时自顶向下逐层把软件系统划分成若干模块的过程。
为了解决复杂的问题,在软件设计中必须把整个问题进行分解来降低复杂性,这样就可以减少开发工作量并降低开发成本和提高软件生产率。但是划分模块并不是越多越好,因为这会增加模块之间接口的工作量,所以划分模块层次和数量应该避免过多或过少。 (3)信息隐蔽
信息隐蔽是指,在一个模块内包含的信息(过程或数据),对于不需要这些信息的其他模块来说是不能访问的。 (4)模块独立性
模块独立性是指,每个模块只完成系统要求的独立的子功能,并且与其他模块的联系最少且接口简单。是评价设计好坏的重要度量标准。衡量软件的模块独立性作用耦合性和内聚性两个定性的度量标准
○1内聚性:内聚性是一个模块内部各个元素间彼此结合的紧密程度的度量。内聚是从功能角度来度量模块内的联系。 内聚有如下的种类,它们之间的内聚性由弱到强排列为:
偶然内聚 逻辑内聚 时间内聚 过程 通信内聚 顺序内聚 功能内聚
内聚性是信息隐蔽和局部化概念的自然扩展。一个模块的内聚性越强则该模块的模块独立性越强。作为软件结构设计的设计原则,要求生一个模块的内部都具有很强的内聚性,它的各个组成部分彼此都密切相关。 ○2耦合性:耦合性是模块间互相连接的紧密程度的度量。
耦合性取决于各个模块之间接口的复杂度、调用方式以及哪些信息通过接口。耦合可以分为下列几种,它们之间的耦合度由高到低排列为:
内容耦合:如一个模块直接访问另一模块的内容,则这两个模块称为内容耦合。
公共耦合:若一组模块都有访问同一全局数据结构,则它之间的耦合称之为公共耦合。 外部耦合:一组模块都访问同一全局简单变量(而不是同一全局数据结构),且不通过参数表传递该全局变量的信息,则称为外部耦合。
控制耦合:若一模块明显地把开头量、名字等信息送入另一模块,控制另一模块的功能,则为控制耦合。
标记耦合:若两个以上的模块都需要其余某一数据结构子结构时,不使用其余全局变量的方式而是用记录传递的方式,即两模块间通过数据结构变换信息,这样的耦合称为标记耦合。
数据耦合:若一个模块访问另一个模块,被访问模块的输入和输出都数据项参数,即两模块间通过数据参数交换信息,则这两个模块为数据耦合。
非直接耦合:若两个模块没有直接关系,它们之间的联系完全是通过主模块的控制和调用来实现的,则称这两个模块为非直接耦合。非直接耦合独立性最强。
耦合性越强,独立性越弱,希望模块之间的耦合表现为非直接耦合方式。但是,由于问题所固有的复杂性和结构化设计的原则,非直接耦合往往是不存在的。
耦合性与内聚性是模块独立性的两个定性标准,耦合与内聚是相互关联的。在程序结构中,各模块的内聚性越强,则耦合性越弱。一般较优秀的软件设计,应尽量做到高内聚,低耦合,即减弱模块之间的耦合性和提高模块内的内聚性,有得提高模块的独立性。
3、 结构设计方法
与结构化需求分析方法相对应的是结构化设计方法。结构化设计就是采用最佳的可能方法设计系统的各个组成部分以及各成分之间的内部联系的技术。也就是说,结构设计是这样一个过程,它决定用哪些方法把哪些部分联系起来,才能解决好某个具体有清楚定义的问题。
结构化设计方法的基本思想是将软件设计成由相对独立、单一功能的模块组成的结构。 二、 概要设计
1、 概要设计的任务 软件概要设计的基本任务是: (1) 设计软件系统结构
在需求分析阶段,已经把系统分解成层次结构,而在概要设计阶段,需要过去时一步分解,划分为模块以及模块的层次结构。划分的具体过程是: ① 采用某种设计方法,将一个复杂的系统按功能划分成模块。 ② 确定每个模块的功能。
③ 确定模块之间的调用关系。 ④ 确定模块之间的接口,即模块之间传递的信息。 ⑤ 评价模块结构的质量。 (2) 数据结构及数据库设计
数据设计是实现需求定义和规格说明过程中提出的数据对象的逻辑表示。数据设计的具体任务是:确定输入、输出文件的详细数据结构;结合算法设计,确定算法所必需的逻辑数据结构及其操作;确定对逻辑数据结构所必须的那些操作的程序模块,限制和确定各个数据设计决策的影响范围;需要与操作系统或调试程序接口所必需的控制表进行数据交换时,确定其详细的数据结构和使用规则;数据的保护性设计:防卫性、一致性、冗余性设计。 数据设计中应注意掌握以下设计原则: ① 用于功能和行为的系统分析原则也应用于数据。 ② 应该标识所有的数据结构以及其上的操作。 ③ 应当建立数据字典,并用于数据设计和程序设计。 ④ 低层的设计决策应该推迟到设计过程的后期。 ⑤ 只有那些需要直接使用数据结构、内部数据的模块才能看该数据的表示。 ⑥ 应该开发一个由有用的数据结构和应用于其上的操作组成的库。 ⑦ 软件设计和程序设计语言应该支持抽象数据类型的规格说明和实现。
(3) 编定概要设计文档。在概要设计阶段,需要编写的文档有,概要设计说明书、数据库设计说明书、集成测试计划等。
(4) 概要设计文档评审。在概要设计中,对设计部分是否完整地实现了需求中规定的功能、性能等要求,设计方案的可行性,关键的处理及内外部接口定义正确性、有效性、各部分之间的一致性等都要进行评审,以免在以后的设计中出现大的问题而返工。
常用的软件结构设计工具是结构图(SC——Structure Chart),也称程序结构图。使用结构图描述软件系统的层次和分块结构关系,它反映了整个系统的功能实现以及模块与模块之间的联系与通讯,是未来程序中的控制层次体系。 结构图是描述软件结构的图形工具。如图3。8所示。
模块用一个矩形表示,矩形内注明模块的功能和名字;箭头表示模块间的调用关系。在结构图中还可以用带注释的箭头表示模块调用过程中来回传递的信息。如果希望进一步标明传递的信息是数据还是控制信息则可用带实心圆的箭头表示传递的是控制信息,用带空心圆的箭头表示传递的是数据。 根据结构化设计思想,结构图构成的基本形式如图
基本形式 顺序形式 重复形式 选择形式
程序结构图的有关术语 深度:表示控制的层数
上级模块、从属模块:上、下两层模块A和B,且有A调用B,则A是上级模块,B是从属模块。 宽度:整体控跨度(最大模块数的层)的表示。 扇入:调用一个给定模块的模块个数。 扇出:一个模块直接调用的其他模块数。 原子模块:树中位于叶子结点的模块。
传入模块:从下属模块取得数据,经处理再将其传送给上级模块。 传出模块:从上级模块取得数据,经处理再将其传送给下必模块。
变换模块:从上级模块取得数据,进行特定的处理,转换成其他形式,再传送给上级模块。 协调模块:对所有下属模块进行协调和管理的模块 2.面向数据流的设计方法
在需求分析阶段,主要是分析信息在系统中加工和流动的情况。面向数据流的设计方法定义了一些不同的映射方法,利用这些映射方法可以把数据流图变换成结构图表示的软件结构。首先需要了解数据流图表示的数据处理的类型,然后针对不同类型分别进行分析处理。 (1)数据流类型
典型的数据流类型有两种:变换型和事务型。
A、变换型。变换型是指信息尚输入通路进入系统,同时由外部形式变换成内部形式,进入系统的信息通过变换中心,经加工处理以后再沿输出通路变换成外部形式离开软件系统。变换型数据处理问题的工作过程大致分为三步,即取得数据、变换数据和输出数据。相应于取得数据、变换数据、输出数据的过程,变换型系统结构图由输入、中心变换和输出等三部分组成。 B、事务型。在很多软件应用中,存在某种作业数据流,它可以引发一个或多个处理,这些处理能够完成该作业要求的功能,这种数据流就叫做事务。事务型数据流的特点是接受一项事务,根据事务处理的特点和性质,选择分派一个适当的处理单元(事务处理中心),然后给出结果。这类数据流归为特殊的一类,称为事务型数据流。在一个事务型数据流中,事务中心接收数据,分析每个事务以确定它的类型,根据事务类型选取一条活动通路。
在事务 型数据流系统结构图中,事务中心模块按所接受的事务类型,选择某一事务处理模块执行,各事务处理模块并列。每个事务处理模块可能要调用若干个操作模块,而操作模块又可能调用若干个细节模块。 (2)面向数据流设计方法的实施要点与设计过程 面向数据流的结构设计过程和步骤是:
第1步:分析、确认数据流图的类型,区分是事务型还是变换型。 第2步:说明数据流的边界。
第3步:把数据流图映射为程序结构。对于事务流区分事务中心和数据接收通咱,将它映射成事务结构。对于变换流区分输出和输入分支,并将其映射成变换结构。
第4步:根据设计准则对产生的结构进行细化和求精。
下面分别讲座变换型和事务型数据流图转换成程序结构图的实施步骤。 变换型
将变换型映射成结构图,又称为变换分析。其步聚如下:
第1步:确定数据流图是否具有变换特性。一般地说,一个系统中所有的信息流都可以认为是变换流,但是,当遇有明显的事务特性的信息流时,建议采采事务分析方法进行设计。
第2步:确定输入流和输出流的边界,划分出输入、变换的输出,独立出变换中心。
第3步:进行第一级分解,将变换型映射成软件结构,其中输入数据处理控制模块协调输出信息的产生过程。 第4步:按上述步骤如出现事务流也可按事务流的映射方式对各个子流进行逐级分解,直至分解到基本功能。
第5步:对每个模块写一个简要说明,内容包括该模块的接口描述、模块内部的信息、过程陈述、包括的主要判定点及任务等。
第6步:利用软件结构的设计原则对软件结构进一步转化。 事务型
将事务型映射成结构图,又称为事务分析。基步骤如下:
事务分析 设计步骤与变换分析设计步骤大致类似,主要差别仅在于由数据流图到软件结构的映射方法不同。它是将事务中心映射成为软件结构中发送分支的调度模块,将接收通路映射成软件结构的接收分支。 3.设计的准则
大量软件设计的实践证明,以下的设计准则是可以借鉴为设计的指导和对软件结构图进行优化。这些准则是: ① 提高模块独立性。对软件结构应首眼于改善模块的独立性,依据降低耦合提高内聚的原则,通过把一些模块取消或合并来修改程序结构。 ② 模块规模适中。 ③ 浓度宽度、扇出和扇入适当。经验表明,好的软件设计结构通常顶层高扇出,中间扇出较少,底层高扇入。 ④ 使模块的作用域在该模块的控制域内。 ⑤ 应减少模块的接口和界面的复杂性。 ⑥ 设计成单入口、单出口的模块。 ⑦ 设计功能可预测的模块。 三、详细设计
详细设计的任务,是为软件结构图中的每一个模块确定实现算法和局部数据结构,用某种选定的表达工具表示算法和数据结构的细节。
常见的过程设计工具有:
图形工具:程序流程图,N-S,PAD,HIPO。 表格工具:判定表。 语言工具:PDL(伪码) 1、程序流程图
2、N-S流程图 为了避免流程图在描述程序逻辑时的随意性与灵活性 特征:
1)每个构件具有明确的功能域;
2)控制转移必须遵守结构化设计要求;
3)易于确定局部数据和(或)全局数据的作用域; 4)易于表达嵌套关系和模块的层次结构。 3、PAD图
是问题分析图的英文缩写。 特征:
1)结构清晰,结构化程度高; 2)易于阅读
3)最左端的纵线是程序主干线,对应程序的第一层结构;每增一层PAD图向左扩展一条纵线,帮程序的纵线数等于程序层次数。
4)程序执行:从PAD图最左主干线上端结点开始,自上而下、自左向右依次执行,程序终止于最左主干线。 4、PDL
过程设计语言也称为结构化的英语的伪码,它是一种混合语言,采用英语的词汇和结构化程序设计语言的语法,类似编程语言。 特征:
1)有为结构化构成元素、数据说明和模块化特征提供的关键词语法; 2)处理部分的描述采用自然语言语法; 3)可以说明简单和复杂的数据结构;
4)支持各种接口描述的子程序定义和调用技术。 3.4软件测试
软件测试是保证软件质量的重要手段,其主要过程涵盖了整个软件生命期的过程,包括需求定义阶段的需求测试、编码阶段的单元测试、集成测试以及后期的确认测试、系统测试,验证软件是否合格、能否交付用户使用等。 一、软件测试的目的
1983年IEEE将软件测试定义为:使用人工或自动手段来运行或测试某个系统的过程,其目的在于检验它是否满足规定的需求或是弄清预期结果与实际结果之间的差别。
关于软件测试的目的, Grenford J.Myers 在《The Art of Software Testing》一书中给出了更深刻的阐述:软件测试是为了发现错误而执行程序的过程;一个好的测试用例子指很可能找到迄今为止尚未发现的错误的用例;一个成功的测试是发现了至今尚未发现的错误的测试。
Myers的观点告诉人们测试要以查找错误为中心,而不是为了演示软件的正确功能。 二、软件测试的准则
1、所有测试都应追溯到需求
软件测试的目的是发现错误,而最严惩的错误不外乎是导致程序无法满足用户需求的错误。 2、严格执行测试计划,排除测试的随意性。
软件测试应当制定明确的测试计划并按照计划执行。测试计划应包括:所测软件的功能、输入和输出、测试内容、各项测试的目的和进度安排、测试资料、测试工具测试用例的选择、资源要求、测试的控制方式和过程等。 3、充分注意测试中的群集现象
经验表明,程序中存在错误的概率与该程序中已发现的错误数成正比。这一现象说明,为了提高测试效率,测试人员应该集中对付那些错误群集的程序。 4、程序员应避免检查自己的程序
为了达到好的测试效果,应该由独立的第三方来构造测试。因为从心理学角度讲,程序人员或设计方在测试自己的程序,要采取客砚的态度是程序不同地存在障碍的。 5、穷举测试不可能
所谓穷举测试是指把程序所有可能的执行路径都进行检查的测试。但是,即使规模较小的程序,其路径排列数也是相当大的,在实际测试过程中不可能穷尽每一种组合。这说明,测试只能证明程序中有错误,不能证明程序中没有错误。 6、妥善保存测试计划、测试用例、出错统计和最终分析报告,为维护提供方便。 三、软件测试技术与方法综述 不同角度分类:
若从是否需要执行被测软件的角度,可以分为静态测试和动态测试方法。若按照功能划分可以分为白盒测试和黑盒测试方法 1、静态测试与动态测试 (1)静态测试
静态测试包括代码检查、表态结构分析、代码质量度量等。静态测试可以由人工进行,充分发挥人的逻辑思维优势,也可以借助软件工具自动进行。经验表明,使用人工测试能够有效地发现30%到70%的逻辑设计和编码错误。
代码检查主要检查代码和设计的一致性,包括代码的逻辑表达的正确性,代码结构的合理性等方面。这项工作可以发现违背程序编写标准的部下,程序中不安全、不明确和模糊的部分,找出程序中不可移植部分、违背程序编程风格的问题,包括变量检查、命名和类型审查、程序逻辑审查、程序语法检查和程序结构检查等内容。代码检查包括代码审查、代码走查、桌面检查、静态分析等具体方式。
代码审查:小组集体阅读、讲座检查代码。
代码走查:小组成员通过用“脑”研究、执行程序来检查代码。
桌面检查:由程序自己编写的程序。程序在程序通过编译之后,进行单元测试之前,对源代码进行分析、检验,并补充相关文档,目的是发现程序的错误。
静态分析:对代码的机械性、程式化的特性分析方法,包括控制流分析、数据流分析、接口分析、表达式分析。 (2)动态测试
静态测试不实际运行软件,主要通过人工进行。动态测试是基于计算机的测试,是为了发现错误而执行程序的过程。或者说,是根据软件开发各阶段的规格说明和程序的内部结构而精心设计一批测试用例(即输入数据及其预期的输出结果),并利用这些测试用例去运行程序,以发现程序错误的过程。
设计高效、合理的测试用例是动态测试的关键。测试用例是为测试设计的数据。测试用例由测试输入数据和与之对应的预期输出结果两部分组成。测试用例的格式为:[(输入值集),(输出值集)] 2、白盒测试方法与测试用例设计
白盒测试方法也称结构测试或逻辑驱动测试。它是根据软件产品的内部工作过程,检查内部万分,以确认每种内部操作符合设计规格要求。白盒测试把测试对象看作一个打开的盒子,允许测试人员利用程序内部的逻辑结构及有送信息来设计或选择测试用例,对程序所有的逻辑路径进行测试。通过在不同点检查程序的状态来了解实际的运行状态是否与预期的一致。所以,白盒测试是在程序内部进行,主要用于完成软件内部操作的验证。
白盒测试的基本原则是:保证所测模块中每一独立路径至少执行一次;保证所测模块所有判断的每一分支至少执行一次;保证所测模块每一循环都在边界条件和一般条件下至少各执行一次;验证所有内部数据结构的有效性。
按照白盒测试的基本原则,“白盒”法是穷举路径测试。在使用这一方案时,测试者必须检查程序的内部结构,从检查程序的逻辑着手,得出测试数据。贯穿程序的独立路径数是天文数字,但即使每条路径都测试了仍然可能有错误。第一,穷举路径测试决不能查出程序是否违反了设计规范,即程序本身是个错误的程序;第二,穷举路径测试不可能查出程序中因遗漏路径而出错;第三,穷举路径测试可能发现不了一些与数据相关的错误。 白盒测试的主要方法有逻辑覆盖、基本路径测试等。 (1)逻辑覆盖测试
逻辑覆盖是泛指一系列以程序内部的逻辑结构为基础的测试用例设计技术。通常所指的程序中的逻辑表示有判断、分支、条件等几种表示方式。
○1语句覆盖。选择足够的测试用例,使得程序中每个语句至少都能被执行一次。 例3.1设有程序流程图表示的程序如图3.24 测试用例1 : 输入
(i , j) 输出 (i , j , x)
(10,10) (10,10,10) 测试用例2: 输入
(i , j) 输出 (i , j , x)
(10,15) (10,15,15)
语句覆盖是逻辑覆盖中基本的覆盖,尤其对单元测试来说。但是语句覆盖往往没有关注判断中的条件有可能隐含的错误。 ○2路径覆盖。执行足够的测试用例,使程序中所有可能的路径都至少经历一次。 例3.2设有程序流程图表示的程序如图3.25
对图3.25的程序设计如表3.2列出的一组测试用例, 就可以覆盖该程序的全部4条路径:ace,abd,abe,acd。
测试用例 通过路径 测试用例 通过路径
[(A=2,B=0,X=3),输出略] (ace) [(A=2,B=1,X=1),输出略] (abe) [(A=1,B=0,X=1),输出略] (abd) [(A=3,B=0,X=1),输出略] (acd) ○3判定覆盖。使设计的测试用例保证程序中每个判断的每个取值分支(T或F)至少经历一次。
根据判定覆盖的要求,对如图3.26所示的程序,如果其中包含条件 i≥j的判断为真值(即为“T”)和为假值(即为“F”)的程序执行路径至少经历一次,仍然可以使用例3.1的测试用例1和测试用例2。 程序每个判断中若存在多个联立条件,仅保证判断的真假值往往会导致某些单个条件的错误不能被发现。例如,某判断是“X<1或Y>5”,其中只要一个条件联欢会为真,无论另一个条件是否错误,判断的结果都为真,这说明,仅有判断覆盖还无法保证能查出在判断的条件中的错误,需要更强的逻辑覆盖。
4条件覆盖。设计的测试用例保证程序中每个判断的生个条件的可能取值至少执行一次。 例3.3设有程序流程图表示的程序如图3.26
按照条件覆盖的测试要求,对图3.26的程序判断框中的条件i≥j和条件j<5设计如下测试用例1和测试用例题,就能保证该条件取真值和取假值的情况至少执行一次。 测试用例1 输入
(i , j) 输出 (i , j , x)
(3,2) (3,2,3)
测试用例2 输入
(i , j) 输出 (i , j , x)
(5,10) (5,10,10)
条件覆盖深入到判断中的每个条件,但是可能会忽略全面的判断覆盖的要求。有必要考虑判断-条件覆盖。
○5判断-条件覆盖。设计足够的测试用例,使判断中每个条件的所有可能取值至少执行一次,同时每个判断的所有可能取值至少执行一次。
例3.4设有程序流程图表示的程序如图3.27
按照判断-条件覆盖的测试要求,对图3。27程序的两个判断框的每个取值分支至少经历一次,同时两个判断框中的三个条件的所有可能取值至少执行一次,设计如下测试用例1、测试用例2和测试用例3,就能保证满足判断-条件覆盖。 输入
(i , j,x) 输出 (i , j , x)
(3,2,0) (3,2,0) 测试用例1
测试用例2 输入
(i , j) 输出
(i , j , x)
(6,4,0) (6,4,6) 输入
(i , j) 输出 (i , j , x)
(5,10,0) (5,10,10) 测试用例3
判断-条件覆盖也有缺陷,对质量要求高的软件单元,可根据情况提出多重条件组合覆盖以及其他更高的覆盖要求。
(2)基本路径测试
基本路径测试的思想和步骤是,根据软件过程性描述中的控制流程确定程序的环路复杂性度量,用此度量定义基本路径集合,并由此导出一组测试用例对每一条独立执行路径进行测试。 例3.5设有程序流程图表示的程序如图3.28
对图3.28的程序流程图确定程序的环路复杂度,方法是:环境复杂度=程序流程图中的判断框个数+1
则环路复杂度的值即为要设计测试用例的基本路径数,图3。28所示的程序环路复杂度为3,设计如表3。3列出的一组测试用例,覆盖的基本路径是:abf , acef , adcf
测试用例 通过路径 [(A=-2,B=0),(输出略)] Abf [(A=5,B=0),(输出略)] Acef [(A=5,B=5),(输出略)] acdf
3.黑盒测试方法与测试用例设计
黑盒测试方法也称功能测试或数据驱动测试。黑盒测试是对软件已经实现的功能是否满足需求进行测试和验证。黑盒测试完全不考虑程序内部的逻辑结构和内部特性,只依据程序的需求和功能规格说明,检查程序的功能是否符合它的功能说明。所以,黑盒测试是在软件接口处进行,完成功能验证。黑盒测试只检查程序功能是否按照需求规格说明书的规定政党使用,程序是否能适当地接输入数据而产生正确的输出信息并且保持外部信息(如数据库或文件)的完整性。
黑盒测试主要诊断功能不对或遗漏、界面错误、数据结构或外部数据库访问错误、性能错误、初始化和终止条件错。 黑盒测试方法主要有等价类划分法、边界值分析法、错误推测试法、因果图等,主要用于软件确认测试。 (1)等价类划分法
等价类划分法是一种典型的黑盒测试方法,它是将程序的所有可能的输入数据划分成若干部分(及若干等价类),然后从每个等价类中选取数据作为测试用例,对每一个等价类,各个输入数据对发现程序中的错误的几率都有是等效的,因此只需从每个等价中选取一些有代表性的测试用例进行测试而发现错误。
使用等价类划分法设计测试方案,首先需要划分输入集合的等价类。等价类包括: ① 有效等价类:合理、有意义的输入数据构成的集合。可以检验程序中符合规定的功能、性能。 ② 无效等价类:不合理、无意义的输入数据构成的集合。可以检验程序中不符合规定的功能、性能。 为此,需要研究程序的功能说明,从而确定输入数据的有效等价类的无效等价类。 等价类划分法实施步骤分为两步: 第1步:划分等价类;
第2步:根据等价类选取相应的测试用例
例3.6程序实现输入3个边长(设为A,B,C),判断能否构成三角形。对该程序考虑等价类划分法。满足测试三角形构成
条件程序的等价类划分如表3。4所示。
输入条件 有效等价类 无效等价类
1边长A,B,C限制 A>0或B>0或C>0 A<=0或B<=0或C<=0
2边长关系限制 A+B>C或B+C>A或A+C>B A+B<=C或B+C<=A或A+C<=B 根据表3。4划分的等价类,可以设计以下的测试用例: 对满足输入条件1和2的有效等价类设计的测试用例: [(A=3,B=4,C=5),(符合三角形构成条件)] 对满足输入条件1的无效等价类设计的测试用例: [(A=-3,B=4,C=5),(无效输入)]
对满足输入条件2的无效等价类设计的测试用例: [(A=3,B=4,C=8),(无效输入)] 划分等价类常用的几条原则是:
若输入条件规定了确切的联欢会范围,则可划分出一个有效等价类和两个无效等价类; 若输入条件规定了输入 值的集合(或有“必须如何”的条件),可确定一个有效等价类和一个无效等价类; 若输入条件是一个布尔量,则可确定一个有效等价类和一个无效等价类;
若输入数据是一组值,且程序要对每个值分别处理。可为每个输入值确定一个有效等价类和一个无效等价类; 若规定了输入数据必须遵守一定规则,则可确定一个有效等价类和若干个无效等价类;
若已划分的等价类中各元素在程序中处理方式不同,须将该等价类进一步划分(更小的等价类)。 (2)边界值分析法
边界值分析法是对各种输入、输出范围的边界情况设计测试用例的方法。
经验表明,程序错误最容易出现在输入或输出范围的边界处,而不是在输入范围的内部。因此针对各种边界情况设计测试用例,可以查出更多的错误。
使用边界值分析法设计测试用例,确定边界情况应考虑选取正好等于,刚刚大于,或刚刚小于边界的值作为测试数据,这样发现程序中错误的概率较大。
边界值分析方法的使用要注意以下几点: ① 如果输入条件规定了取值范围或数据个数,则可选择正好等于边界值、刚刚在边界范围内和刚刚超越边界外的值进行测试; ② 针对规格说明的每个输入条件,使用上述原则; ③ 对于有序数列,选择第一个和最后一个作为测试数据。 一般多用边界值分析法来补充等价类划分方法。 (3)错误推测法
人们可以靠经验和直觉推测程序中可能存在的各种错误,从而有针对性地编写检查这些错误的例子,这就是错误推测法。 错误推测法的基本想法是:列举出程序中所有可能有的错误和容易发生错误的特殊情况,根据它们选择测试用例。错误推测法针对性强,可以直叫苄入可能的错误,直接定位,是一种非常实用、有效的方法。但是它需要丰富的经验和专业知识。 错误推测法的实施步聚一般是,对被测软件首先列出所有可能有的错误和易错情况表,然后基于该表设计测试用例。
例如,一般程序中输入为0或输出为0的情形是易错情总,测试者可以设计输入值为0的测试情况,以及使输出强迫为0的测试情况。
例如,要测试一个排序子程序,特别需要检查的情况是:输入表为空;输入表只含有一个元素;输入表的所有元素的值都相同;输入表已经排过序。这些情况都在程序设计时可能忽略的特殊情况。
实际上,无论是使用白盒测试方法还是黑盒测试方法,或是其他测试方法,针对一种方法设计的测试用例,仅仅是易于发现某种类型的错误,对其他类型的错误不易发现,所以没有一种用例设计方法能适应全部的测试方案,而是各有所长,综合使用各种方法来确定合适的测试方案,应该考虑在测试成本和测试效果之间的一个合理折中。 四、 软件测试的实施
软件测试是保证软件质量的重要手段,软件测试是一个过程,其测试流程是该过程规定的程序,目的是使软件测试工作系统化。
软件测试过程一般按4个步骤进行,即单元测试,集成测试、验收测试(确认测试)和系统测试。 通过这些步骤的实施来验证软件是否合格,能否交付用户使用。 1、 单元测试
单元测试是对软件设计的最小单位——模块(程序单元)进行正确性检验的测试。单元测试的目的是发现各模块内部可能存在的各种错误。
单元测试的依据是详细设计说明书和源程序。
单元测试的技术可以采用静态分析和动态测试。对动态测试通常以白盒动态测试为主,辅之以黑盒测试。
单元测试主要针对模块的下列5个基本特性进行: ① 模块接口测试——测试通过模块的数据流。例如,检查模块的输入参数和输出参数、全局量、文件属性与操作等都属于模块接口测试的内容。 ② 局部数据结构测试。例如,检查局部数据说明的一致性,数据的初始化,数据类型的致以及数据的下溢、上溢等。 ③ 重要的执行路径的检查。 ④ 出错处理测试。检查模块的错误处理功能。 ⑤ 影响以上各点及其他相关点的边界条件测试。
单元测试是针对某个模块,这样的模块通常并不是一个独立的程序,因此模块自己不能运行,而要靠辅助其他模块调用或驱动。同时,模块自身也会作为驱动模块去调用其他模块,也就是说,单元测试要考虑它和外界的联系,必须在一定的环境下进行,这些环境可以是真实的也可以是模拟的。模拟环境是单元测试常用的。
所谓模拟环境就是在单元测试中,用一些辅助模块去模拟与被测试模块的相联系的其他模块,即为被测模块设计和搭建驱动模块和桩模块。
其中,驱动模块相当于被测模块的主程序。它接收测试数据,并传给被测模块,输出实际测试结果。桩模块通常用于代替被测模块调用的其他模块,其作用仅做少量的数据操作,是一个模拟子程序,不必将模块的所有功能带入。 2.集成测试
集成测试是测试和组装软件的过程。它是把模块在按照设计要求组装起来的同时进行测试,主要目的是发现与接口有关的错误。集成测试的依据是概要设计说明书。
集成测试所涉及的内容包括:软件单元的接口测试、全局数据结构测试、边界条件和非法输入的测试等。 集成测试时效模块组装成程序通常采用两种方式:非增量方式组装与增量方式组装。
非增量方式也称为一次性组装方式。将测试好的每一个软件单元一次组装在一起再进行整体测试。
增量方式是将已经测试好的模块逐步组装成较大系统,在组装过程中边连接边测试,以发现连接过程中产生的问题。最后通过增殖,逐步组装至所要求的软件系统。
增量方式包括自顶向下、自底向上、自顶向下与自底向上相结合的混合增量方法。 (1) 自顶向下的增量方式
将模块按系统程序结构,从主控模块(主程序)开始,沿控制层次自顶向下地逐个把模块连接起来。自顶向下的增量方式在测试过程中能较早地验证主要的控制的判断点。 自顶向下集成的过程与步骤如下: ① 主控模块作为测试驱动器。直接附属于主控模块的各模块全都用桩模块代替。 ② 按照一定的组装次序,每次用一个真模块取代一个附属的桩模块。 ③ 当装入每个真模块时都要进行测试。 ④ 做完每一组测试后再用一个真模块代替另一个桩模块。 ⑤ 可以进行回归测试(即重新再做过去做过的全部或部分测试),以便确定没有新的错误发生。 例3.7对图3。30(A)所示程序结构进行自顶向下的增量方式组装测试。 自顶向下的增量方式的组装过和如图3。30(B)~(F)所示 (2) 自底向上的增量方式
自底向上集成测试方法是从软件结构中最底层的、最基本的软件单元开始进行集成和测试。在模块的测试过程中需要从子模块得到的信息可以直接运行子模块得到。由于在逐步向上组装过程中下层模块总是存在的,因此不再需要桩模块,但是需要调用这些模块的驱动模块。
自底向上集成的过程与步骤如下: ① 低层的模块组成簇,以执行某个特定的软件子功能。 ② 编写一个驱动模块作为测试的控制程序,和被测试的簇连在一起,负责安排测试用例的输入及输出。 ③ 对簇进行测试。 ④ 拆去各个小簇的驱动模块,把几个小簇合并成大簇,再重复做2。3。4步。这样在软件结构上逐步向上组装。 例3.8对图3。31(A)所示程序结构进行自底向上的增量方式的组装测试。 自底向上的增量方式的组装过程如图3。31(B)至(D)所示。 (3) 混合增量方式
自顶向下增量的方式和自底向上增量的方式各有优缺点,一种方式的优点是另一种方式的缺点。
被测程序(A) 加入A 加入B 加入E
加入C 加入D 自顶向下的增量测试
自底向上的增量测试
自顶向下测试的主要优点是能较早显示出整个程序的轮廓,主要缺点是,当测试上层模块时使用桩模块较多,很难模拟出真实模块的全部功能,使部分测试内容被迫推迟,直至换上真实模块后再补充测试。
自底向上测试从下层模块开始,设计测试用例比较容易,但是在测试的早期不能显示出程序的轮廓。
针对自顶向下、自底向上方法各自的优点和不足,人们提出了自顶向下的自底向上相结合、从两头向中间逼近的混合式组装方法,被形象称之为“三明治”方法。这种方式,结合考虑软件总体结构的良好设计原则,在程序结构的高层使用自顶向下方式 ,在程序结构的低层使用自底向上方式。 3.确认测试
确认测试的任务是验证软件功能和性能及其他特性是否满足了需求规格说明中确定的各种需求,以及软件配置是否完全、正确。
确认测试的实施首先运用黑盒测试方法,对软件进行有效性测试,即验证被测试软件是否满足需求规格说明确认的标准。复审的目的在于保证软件配置齐全、分类有序,以及软件配置所有成分的完备性、一致性、准确性和可操作性,并且包括软件维护所必需的细节。 4、系统测试
系统测试是将通过测试确认的软件,作为整个基于计算机系统的一个元素,与计算机硬件、外设、支持软件、数据和人员等其他系统元素组合在一起,在实际运行(使用)环境下对计算机系统进行一系列的集成测试和确认测试。由此可知,系统测试必须在目标环境下运行,其功用在于评估系统环境下软件的性能,发现和捕捉软件中潜在的错误。
系统测试的目的是在真实的系统工作环境下检验软件是否能与系统正确连接,发现软件与系统需求不一致的地方。 系统测试的具体实施一般包括:功能测试、性能测试、操作测试、配置测试、外部接口测试、安全性测试等。 3.5程序的调试 一、基本概念
在对程序进行了成功的测试之后将进入程序调试(通常称Debug,即排错)。程序调试的任务是诊断和改正程序中的错误。它
与软件测试不同,软件测试是尽可能多地发现软件中的错误。先要发现软件的错误,然后借助于一定的调试工具去执行找出软件错误的具体位置。软件测试贯穿整个软件生命期,调试主要在开发阶段。
由程序调试的概念可知,程序调试活动由两部分组成,其一是根据错误的迹象确定程序中错误的确切性质、原因和位置。其二,对程序进行修改,排除这个错误。 1、 程序调试的基本步骤 (1) 错误定位
从错误的外部表现形式入手,研究有关部分的程序,确定程序中出错位置,找出错误的内在原因。确定错误位置占据了软件调试绝大部分的工作量。
从技术角度来看,错误的特征和查找错误的难度在于: ① 现象与原因所处的位置可能相距很远。就是说,现象可能出现在程序的一个部位,而原因可能在离此很远的另一个位置。高耦合的程序结构中这种情况更为明显。 ② 当纠正其他错误时,这一错误所表现出的现象可能会消失或暂时性消失,但并未实际排除。 ③ 现象可能并不是由错误引起的(如舍入误差)。 ④ 现象可能性是由于一些不容易发现的人为错误引起的。 ⑤ 错误现象可能时有时无。 ⑥ 现象是由于难于再现的输入状态(例如实时应用中输入顺序不确定)引起的。 ⑦ 现象可能是周期出现的。
(2) 修改设计和代码,以排除错误
排错是软件开发过程中一项艰苦的工作,这也决定了调试工作是一个具有很强技术性和技巧性的工作。软件工程人员在分析测试结果的时候会发现,软件运行失效或出现问题,往往只是潜在错误的外部表现,而外部表现与内在原因之间常常没有明显的联系。如果要找出真正的原因,排除潜在的错误,不是一件易事。因此可以说,调试是通过现象,找出原因的一个思维分析的过程。
(3) 进行回归测试,防止引进新的错误
因为修改程序可能带来新的错误,重复进行暴露这个错误的原始测试或某些有关测试,以确认该错误是否被排除、是否引进了新的错误。如果所做的修正无效,则撤销这次改动,重复上述过程,直到找到一个有效的解决办法为止。 2、 程序调试的原则
在软件调试方面,许多原则实际上是心理学方面的问题。因为调试活动由对程序中错误的定性,定位和排错两部分组成,因此调试原则 也从以下两个方面考虑。
(1) 确定错误的性质和位置时的注意事项: ① 分析思考与错误征兆有关的信息。 ② 避开死胡同。 ③ 只把调试工具当作辅助手段来使用。 ④ 避免用试探法,最多只能把它当作最后手段。 (2) 修改错误的原则 ① 在出现错误的地方,很可能还有别的错误。经验表明,错误吸群集现象,当在某一程序段发现有错误时,在该程序段中还存在另的错误的概率也很高。因此,在修改一个错误时,还要观察和检查相关的代码,看是否还有别的错误。 ② 修改错误的一个觉失误是只修改了这个错误的征兆或这个错误的表现,而没有修改错误本身。如果提出的修改不能解释与这个错误有关的全部现象,那就表明了只修改了错误的一部分。 ③ 注意修正了一个错误的同时有可能会引入新的错误。 ④ 修改错误的过程将迫使人们暂时回到程序设计阶段。修改错误也是程序设计的一种形式。一般说来,在程序设计阶段所使用的任何方法都可以应用到错误修正的过程中来。 ⑤ 修改源代码程序,不要改变目标代码。 二、软件调试方法
调试的关键在于推断程序内部的错误位置及原因。从是否跟踪和和执行程序的角度,类似于软件测试,软件调试可以分为静态调试和动态调试。软件测试中讲座的表态分析方法同样适用静态调试。静态调试主要指通过人的思维来分析源程序代码和排错,是主要的调试手段,而动态调试是辅助静态调试的。主要的调试方法可以采用: 1、强行排错法 ① 通过内存全部打印来排错。 ② 在程序特定部位设置打印语句——即断点法。输出存储器内容,就是在程序执行到某一行的时候,计算机自动停止运行,并保留这时各变量的状态,方便检查,校对。 ③ 自动调试工具。其功能是设置断点,当程序执行到某个特定的语句或某个特定的变量值改变是地,程序暂停执行。程序可在终端上观察程序此时的状态。
应用以上任何一种技术之前,都应当对错误的征兆进行全面彻底的分析,得出对出错位置及错误性质的推测,再使用一种适当的排错方法来检验推测的正确性。 2、回溯法
该方法适合于小规模程序的排错。即一旦发现了错误,先分析错误征兆,确定最先发现“症状”的位置。然后,从发现“症状”的地方开始,沿程序的控制流程,逆向跟踪源程序代码,直到找到错误根源或确定错误产生的范围。 3、 原因排除法
原因排除法是通过演绎和归纳,以及二分法来实现的。
演绎法是一种从一般原理或前提出发,经过排除和精化的过程来推导出结论的思考方法。演绎法排错是测试人员首先根据已有的测试用例,设想及枚举出所有可能出错的原因作为假设。然后再用原始测试数据或新的测试,从中逐个排除不可能正确的假设。最后,再用测试数据验证余正气假设确定出错的原因。
归纳法是一种从特殊扒断出一般的系统化思考方法。其基本思想是从一些线索(错语征兆或与错误发生有关的数据)着手,通过分析寻找到潜在的原因,从而找出错误。
二分法实现的基本思想是,如果已知每个变量在程序中若干个关键点的正确值,则可以使用宣传语句(如赋值语句、输入语句等)在程序中的某点附近给这些变量赋正确值,然后运行程序并检查程序的输出。如果输出结果是正确的,则错误原因在程序的前半部分;反之,错误原因在程序的后半部分。对错误原因所在的部分重复使用这种方法,直到将出错范围缩小到容易诊断的程序为止。
需要注意的一个实际问题是,调试的成果是排错,为了修改程序中错误,往往会采用“补丁程序”来实现,而这种做法会引起整个程序质量的下降,但是从目前程序设计发展的状况看,对大规模的程序的修改和质量保证,又不失为一种可行的方法。 习题3
一、 选择题
1、 软件生命周期中,能准确地确定软件系统必须做什么和必须具备哪些功能的阶段是
A、概要设计 B、详细设计 C、可行性分析 D、需要分析 2、下面不属于软件工程的3个要素的是
A、工具 B、过程 C、方法 D、环境
3、检查软件产品是否符合需求定义的过程称为
A、确认测试 B、集成测试 C、验证测试 D、验收测试
4、数据流图用于抽象描述一个软件逻辑模型,数据流图由一些特定的图符构成。下列图符名标识的图符不属于数据流图合法图符的是
A、控制流 B、加工 C、数据存储 D、源和潭 5、下面不属于软件设计原则的是
A、抽象 B、模块化 C、自底向上 D、信息隐蔽 6、程序流程图(PFD)中的箭头代表的是
A、数据 流 B、控制 流 C、调用关系 D、组成关系
7、下列工具中为需求分析常用工具的是
A、PAD B、PFD C、N-S D、DFD 8、在结构化方法中,软件功能分解属于列软件开发中的阶段是
A、详细设计 B、需求分析 C、总体设计 D、编程调试 9、软件调试的目的是
A、发现错误 B、改正错误 C、改善软件的性能 D、挖掘软件的潜能 10、软件需求分析阶段的工作,可以分为四个方面:需求获取,需求分析,编写需求规格说明书,以及
A、阶段性报告 B、需求评审 C、总结 D、都不正确 二、填空题
1、软件是程序、数据和 的集合。
2、Jackson方法是一种面向 的结构化方法。 3、数据流图的类型有 和事务型。
4、软件工程研究的内容主要包括: 技术和软件工程管理。 5、软件开发环境是全面支持软件开发全过程的 集合。 软件工程基础
3.1软件工程基本概念 一、软件定义与软件特点
计算机软件是计算机系统中与硬件相互依存的另一部分,是包括程序、数据及相关文档的完整集合。基中,程序是软件开发人员根据用户需求开发的用程序设计语言描述的、适合计算机执行的指令(语句)序列。数据是使程序能正常操纵信息的数据结构。文档是与程序开发、
维护和使用有关的图文资料。可见软件由两部分组成:一是机器可执行的程序和数据;二是机器不可执行的,与软件开发、运行、维护、使用等有关的文档。
国标(GB)中对计算机软件的定义为:与计算机系统的操作有关的计算机程序、规程、规则,以及可能有的文件、文档及数据。
软件在开发、生产、维护和使用等方面与计算机硬件相比存在明显的差异。深入理解软件的定义需要了解软件的特点: (1) 软件是一种逻辑实体,而不是物理实体具有抽象性。
(2) 软件的生产与硬件不同,它没有明显的制作过程。一旦研制开发成功,可以大量拷贝同一内容的副本。所以对软件的控制,必须着重在软件开发方面下功夫。
(3) 软件在运行、使用期间不存在磨损、老化问题。
(4) 软件的开发运行对计算机系统具有依赖性,受计算机系统的限制这导致了软件移植的问题。 (5) 软件复杂性高,成本昂贵。 (6) 软件开发涉及诸多的社会因素。
软件按功能可以分为:应用软件、系统软件、支撑软件(或工具软件)。应用软件是为解决特定领域的应用而开发的软件。系统软件是计算机管理自身资源,提高计算机使用效率并为计算机用户提供各种服务的软件。支撑软件是介于系统软件和应用软件之间,协助用户开发软件的工具性软件,包括辅助和支持开发和维护应用软件的工具软件。 二、软件危机与软件工程
软件工程概念的出现源自软件危机。
所谓有软件危机四伏是泛指在计算机软件开发和维护过程中所遇到的严重问题。实际上,几科所有的软件都不同程度地存在这些问题。
随着计算机技术的发展和应用领域的扩大,计算机硬件性能/价格比和质量稳步提高,软件规模越来越大,复杂程度不断增加,软件成本逐年上升,质量没有可靠的保证,软件已成为计算机科学发展的“瓶颈”。 具体地说,在软件开发和维护过程中,软件危机主要表现在:
(1) 软件需求的增长得不到满足。用户对系统不满意的情况经常发生。
(2) 软件开发成本和进度无法控制。开发成本超出预算,开发周期大大超过规定日期的情况经常发生。 (3) 软件质量难以保证。
(4) 软件不可维护或护程度非常低。 (5) 软件的成本不断提高。
(6) 软件开发生产率的提高赶不上硬件的发展和应用需求的增长。 总之,可以将软件危机归结为成本、质量、生产率等问题。
软件工程就是试图用工程、科学和数学的大批量与方法研制、维护计算机软件的有关技术及管理方法。
关于软件工程的定义,国标(GB)中指出,软件工程是应用于计算机软件的定义、开发和维护的一整套方法、工具文档、实践标准的工序。
1993年IEEE(Institute of Electrical &Electronic Engineers ,电气和电子工程师学会)给出了一个更加综合的定义:“将系统化的、规范的、可度量的方法应用于软件的开发、运行和维护的过程,即将工程化应用于软件中”。
软件工程包括3个要素:即方法、工具和过程。方法是完成软件工程项目的技术手段;工具支持软件的开发、管理、文档生成;过程支持软件开发的各个环节的控制、管理。
软件工程的核心思想是把软件产品看作是一个工程产品来处理。
开发软件不能只考虑开发期间的费用,而且应考虑软件生命周期内的全部费用。因此,软件生命周期的概念就变得特别重要。在考虑软件费用时,不仅仅要降低开发成本,更要降低整个软件生命周期的总成本。 三、软件工程过程与软件生命周期
1、软件工程过程(Software Engineering Process)
ISO9000定义:软件工程过程是把输入转化为输出的一组彼此相关的资源和活动。
定义支持了软件工程过程的两方面内涵。其一,软件工程过程是指为获得软件产品,在软件工具支持下由软件工程师完成的一系列软件工程活动。基于这个方面,软件工程过程通常包含4种基本活动: (1) P(plan)——软件规格说明。规定软件的功能及其运行时的限制。 (2) D(do)——软件开发。产生满足规格说明的软件。
(3) C(check)——软件确认。确认软件能够满足客户提出的要求。
(4) A (action)——软件演进。为满足客户的变更要求,软件必须在使用的过程中演进。
通常把用户的要求转变成软件产品的过程也叫做软件开发过程。此过程包括对用户的要求进行分析,解释成软件需求,把需
求变换成设计,把设计用代码来实现并进行代码测试,有些软件还需要进行代码安装和交付运行。 其二,从软件开发的观点看,它就是使用适当的资源(包括人员、硬软件工具、时间等),为开发软件进行的一组开发活动,在过程结束时将输入(用户要求)转化为输出(软件产品)。
所以,软件工程的过程是将软件工程的方法和工具综合起来,以达到合理、及时地进行计算机软件开发的目的。软件工程过程应确定方法使用的顺序、要求交付的文档资料、为保证质量和适应变化所需要的管理、软件开发各个阶段完成的任务。 2、软件生命周期(software life cycle)
通常,将软件产品从提出、实现、使用维护到停止使用退役的过程称为软件生命周期。一般包括可行性研究与需求分析、设计、实现、测试、交付使用以及维护等活动。
还可以将软件生命周期分为软件定义、软件开发及软件运行维护三个阶段。软件生命周期的主要活动阶段是:
(1) 可行性研究与计划制定。确定待开发软件系统的开发目标和总的要求,给出它的功能、性能、可靠性以及接口等方面的可能方案,制定完成开发任务的实施计划。
(2) 需求分析。对待开发软件提出的需求进行分析并给出详细定义。编写软件规格说明书及初步的用户手册,提交评审。
(3) 软件设计。系统设计人员和程序设计人员应该在反复理解软件需求的基础上,给出软件的结构、模块和划分、功能的分配及处理流程。在系统比软件复杂的情况下,设计阶段可分解成概要设计阶段和详细设计阶段。编写概要设计说明书、详细设计说明书和测试计划初稿,提交评审。
(4) 软件实现。把软件设计转换成计算机可以接受的程序代码。即完成源程序的编码,编写用户手册、操作手册等面向用户的文档,编写单元测试计划。
(5) 软件测试。在设计测试用例的基础上,检验软件的各个组成部分。编写测试分析报告。
(6) 运行和维护。将已交付的软件投入运行,并在运行使用中不断地维护,根据新进出的需求进行必要而且可能的扩充和删改。
四、软件工程的目标与原则 1、软件工程的目标
软件工程的目标是,在给定成本、进度的前提下,开发出具有有效性、可靠性、可理解性、可维护性、可重用性、可适应性、可移植性、可追踪性和可互操作性且满足用户需求的产品。
软件工程需要达到的基本目标应是:付出较低的开发成本;达到要求的软件功能;取得较好的软件性能;开发的软件易于移植;需要较低的维护费用;能按时完成开发,及时交付使用。
基于软件工程的目标,软件工程的理论和技术性研究的内容主要包括:软件开发技术和软件工程管理。 (1) 软件开发技术
软件开发技术包括:软件开发法学、开发过程、开发工具和软件工程环境,其主体内容是软件开发方法学。软件开发方法学是根据不同的软件类型,按不同的观点和原则,对软件开发中应遵循的策略、原则、步骤和必须产生的文档资料都做出规定,从而使软件的开发能够进入规范化和工程化的阶段,以克服早期的手工方法生产中的随意性和非规范性做法。 (2) 软件工程管理
软件工程管理包括:软件管理学、软件工程经济学、软件心理学等内容。
软件工程管理是软件按工程化生产时的重要环节,它要求按照预选制定的计划、进度和预算执行,以实现预期的经济效益和社会效益。
软件工程经济学是研究软件开发中成本的估算、成本效益分析的方法和技术,用经济学的基本原理来研究软件工程开发中的经济效益问题。
软件心理学是软件工程领域具有挑战性的一个全新的研究视角,它是从个体心理、人类行为、组织行为和企业文化等角度来研究软件管理和软件工程的。 2、软件工程的原则
为了达到上述的软件工程目标,在软件开发过程中,必须遵循软件工程的基本原则。这些基本原则包括抽象、信息隐蔽、模块化、局部化、确定性、一致性、完备性和可验证性。
(1) 抽象。抽取事物最基本的特性和行为,忽略非本质细节。采用分层次抽象,自顶向下,逐层细化的办法控制软件开发过程的复杂性。
(2) 信息隐蔽。采用封闭技术,将程序模块的实现细节隐藏起来,使模块接口尽量简单。
(3) 模块化。模块是程序中相对独立的成分,一个独立的编程单位,应有良好的接口定义。模块的大小要适中,模块过大会使模块内部的复杂性增加,不得对模块的理解和个性也不得模块的调试和重用。模块太小会导致整个系统表示过于复杂,不利于控制系统的复杂性。
(4) 局部化。要求在一个物理模块内集中逻辑上相互关联的计算资源,保证模块间具有松散的耦合关系,模块内部有较强的内骤性,这有助于控制角的复杂性。
(5) 确定性软件开发过程中所有概念的表达应是确定的、无歧义且规范的。这有助于人与人的交互不会产生误解
和遗漏,以保证整个开发工作的协调一致。
(6) 一致性。扬程序、数据和文档的整个软件系统的各模块应使用已知的概念、符号和术语;程序内外部接口应保持一致,系统规格说明与系统行为应保持一致。
(7) 完备性。软件系统不丢失任何重要成分,完全实现系统所需的功能。
(8) 可验证性。开发大型软件系统需要对系统自顶向下,逐层分解。系统分解应遵循容易检查、测评、评审的原则,以确保系统的正确性。
五、软件开发工具与软件开发环境
现代软件工程方法之所以千里马实施,其重要的保证是软件开发工具的环境的保证,使软件在开发效率、工程质量等多方面得到改善。软件工程鼓励研制和采用各种先进的软件开发方法、工具和环境。工具和环境的使用进一步提高了软件的开发效率、维护效率和软件质量。 1、 软件开发工具 2、 软件开发环境
软件开发环境或称软件工程环境是全面支持软件开发全过程的软件工具集合。
计算机辅助软件工程(CASE,computer aided software engineering)是当前软件开发环境中富有特色的研究工作和发展方向。CASE将各种软件工具、开发机器和一个慧放开发过程信息的中心数据库组合起来,形成软件工程环境。CAS3E的成功产品将最大限度地降低软件开发的技术难度并使软件开发的质量得到保证。