第一章 数据结构与算法
1.1 算法
1、算法是指解题方案的准确而完整的描述。换句话说,算法是对特定问题求解步骤的一种描述。
算法规定了解决某类问题所需的操作语句以及执行顺序,使其能通过有限的指令语句,在一定时间内解决问题。
算法是一个操作序列、有限长度,目的是解决某类问题。
*:算法不等于程序,也不等于计算方法。程序的编制不可能优于算法的设计。 2、算法的基本特征
(1)可行性。针对实际问题而设计的算法,执行后能够得到满意的结果。
(2)确定性。每一条指令的含义明确,无二义性。并且在任何条件下,算法只有唯一的一条执行路径,即相同的输入只能得出相同的输出。
(3)有穷性。算法必须在有限的时间内完成。有两重含义,一是算法中的操作步骤为有限个,二是每个步骤都能在有限时间内完成。
(4)拥有足够的情报。指的是有足够的输入和输出。
*:综上所述,所谓算法,是一组严谨地定义运算顺序的规则,并且每一个规则都是有效的,且是明确的,此顺序将在有限的次数下终止。
3、算法的基本要素
一个算法通常由两种基本要素组成:一是对数据对象的运算和操作;二是算法的控制结构。 (1)算法中对数据的运算和操作
每个算法实际上市按解题要求从环境能进行的所有操作中选择合适的操作所组成的一组指令序列。因此,计算机算法就是计算机能处理的操作所组成的指令序列。
在一般的计算机系统中,基本的运算和操作有以下四类: ①算术运算:主要包括加、减、乘、除等运算;
②逻辑运算:主要包括与(AND)、或(OR)、非(NOT)等运算; ③关系运算:主要包括大于、小于、等于、不等于等运算 ④数据传输:主要包括赋值、输入、输出等操作。 (2)算法的控制结构
顺序、选择和循环。
4、算法的基本方法(计算机解题的过程实际上是在实施某种算法)
(1)列举法(列举所有解决方案)
根据提出的问题,列举所有可能的情况,并用问题中给定的条件检验哪些是
需要的,哪些是不需要的。
(2)归纳法(特殊->一般)适合于列举量为无限的情况
通过列举少量的特殊情况,经过分析,最后找出一般的关系。 (3)递推法 (已知->未知)
从已知的初始条件出发,逐次推出所要求的各中间结果和最后结果。 (4)递归法(逐层分解)
将一个复杂的问题归结为若干个较简单的问题,然后将这些较简单的每一个
问题再归结为更简单的问题 (5)减半递推法
“减半”是指将问题的规模减半,而问题的性质不变,所谓“递推”是指重
复“减半”的过程。 (6)回溯法
复杂应用,找出解决问题的线索,然后沿着这个线索逐步多次“探”、“试”。 5、算法复杂度主要包括时间复杂度和空间复杂度。 算法的复杂度是衡量算法好坏的量度。
(1)算法时间复杂度是指执行算法所需要的计算工作量,可以用执行算法的过程中所需基本运算的执行次数来度量。 影响计算机工作量的主要因素:
第一:基本运算次数; 第二:问题规模。 下面的方法不能用来度量算法的时间复杂度:
第一:算法程序的长度或算法程序中的语句(指令)条数; 第二:算法程序所执行的语句条数; 第三:算法程序执行的具体时间
(2)算法空间复杂度是指执行这个算法所需要的内存空间。
一个算法所用的内存空间包括: 1)算法程序所占用的存储空间; 2)输入的初始数据所占的存储空间;3)算法执行过程中的额外空间。 6、考题练习:
1)下列叙述正确的是() (A)算法就是程序
(B)算法强调的是利用技巧提高程序执行效率 (C)设计算法时只需考虑结果的可靠性 (D)以上三种说法都不对 2)下面叙述正确的是()
(A)算法的执行效率与数据的存储结构无关
(B)算法的空间复杂度是指算法程序中指令(或语句)的条数 (C)算法的有穷性是指算法必须能在执行有限个步骤之后终止 (D)以上三种描述都不对 3)下列叙述中正确的是()
(A)一个算法的空间复杂度大,则其时间复杂度也必定大 (B)一个算法空间复杂度大,则其时间复杂度必定小 (C)一个算法的时间复杂度大,则其时间复杂度必定小 (D)以上三种说法都不对
4)算法的空间复杂度是指( ) (A)算法程序中变量的个数 (B)算法程序中的指令条数
(C)算法程序中各控制变量所占的额外空间 (D)算法执行过程中所需要的存储空间
1.2 数据结构的基本概念
目的:提高数据处理的效率(一是提高数据处理的速度;二是尽量节省在数据处理过程中所占用的计算机存储空间) 1、基本概念:
1)数据:在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。 2)数据元素:数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。
3)数据结构:是指相互有关联的数据元素的集合。
线性表 栈 线性结构 队列 数据的逻辑结构 树形结构 非线性结构 图形结构
顺序存储 数据的存储结构 链式存储
数据的运算:检索、排序、插入、删除、修改
2、逻辑结构:数据元素之间的逻辑关系,从逻辑关系上描述数据,它与数据的存储无关,是独立于计算机的。
3、存储(物理)结构:是指数据元素及其关系在计算机内存中的表示,即数据的逻辑结构在计算机存储空间中的存放形式。
注意:对于同一个逻辑结构来说,采用不同的存储结构,其数据处理的效率是不同的。因此,在数据处理时,选择合适的存储结构很重要。
各数据元素在计算机存储空间中的位置关系与它们的逻辑关系不一定相同。 由于数据元素在计算机存储空间中的位置关系可能与逻辑关系不同,因此,为了表示存放在计算机存储空间中的各数据元素之间的逻辑关系(即前后间关系)在数据结构中,不仅要存放各数据元素的本身,而且还需要存放各数据元素之间的前后件关系的信息。
4、逻辑结构与物理结构的关系:
(1)一种逻辑结构可以用不同的物理结构来实现 (2)逻辑结构决定了算法的设计 (3)物理结构决定了算法的实现
数据结构的图形表示:表示数据结构的常用方法:二元关系表和图形表示。 例:一年四季的数据结构可以表示成: 用图形表示为: 春 夏秋 冬
1) 数据元素:用中间标有元素值的方框来表示,称为数据结点,简称为结点。
2) 元素之间的前后关系:用一条有向线段从前件结点指向后件结点(有时可以省略箭头) 例如:家庭成员数据结构可以表示称为:
父亲 儿子 女儿
在数据结构中,没有前件的结点称为根结点,没有后件的结点称为终端结点(也称为叶子结点)其它的称为内部结点。
5、线性结构与非线性结构 数据结构的分类:
根据数据结构中各数据元素之间的前后关系的复杂度,一般将数据结构分成两大类:线性结构和非线性结构。
注意:线性结构与非线性结构是在数据的逻辑结构概念下的一种划分方法,与数据的存储结构无关。前面说过,一种数据的逻辑结构根据需要可以表示成多种存储结构,但只要数据的逻辑结构是属于线性结构,则该逻辑结构的任意一种存储结构也都属于线性结构。 6、线性结构的定义:
如果一个非空的数据结构满足下列两个条件:
(1) 有且只有一个根结点(每有前件的结点称为根结点)
(2) 每个结点最多有一个前件,也最多有一个后件。则称该数据结构为线性结构,线
性结构又称为线性表。
(3) 线性结构的操作。
在一个线性结构中插入或删除任何一个结点后还应是线性结构。
1.3 线性表及其顺序存储结构
1、线性表由一组数据元素构成,数据元素的位置只取决于自己的序号,元素之间的相对位置是线性的。线性表是由n(n≥0)个数据元素组成的一个有限序列,表中的每一个数据元素,除了第一个外,有且只有一个前件,除了最后一个外,有且只有一个后件。线性表中数据元素的个数称为线性表的长度。线性表可以为空表。
*:线性表是一种存储结构,它的存储方式:顺序和链式。
2、线性表的顺序存储结构具有两个基本特点:(1)线性表中所有元素所占的存储空间是连续的;(2)线性表中各数据元素在存储空间中是按逻辑顺序依次存放的。
*:由此可以看出,在线性表的顺序存储结构中,其前后件两个元素在存储空间中是紧邻的,且前件元素一定存储在后件元素的前面,可以通过计算机直接确定第i个结点的存储地址。 3、顺序表的插入、删除运算
(1)顺序表的插入运算:在一般情况下,要在第i(1≤i≤n)个元素之前插入一个新元素时,首先要从最后一个(即第n个)元素开始,直到第i个元素之间共n-i+1个元素依次向后移动一个位置,移动结束后,第i个位置就被空出,然后将新元素插入到第i项。插入结束后,线性表的长度就增加了1。
*:顺性表的插入运算时需要移动元素,在等概率情况下,平均需要移动n/2个元素。 (2)顺序表的删除运算:在一般情况下,要删除第i(1≤i≤n)个元素时,则要从第i+1个元素开始,直到第n个元素之间共n-i个元素依次向前移动一个位置。删除结束后,线性表的长度就减小了1。*:进行顺性表的删除运算时也需要移动元素,在等概率情况下,平均需要移动(n-1)/2个元素。插入、删除运算不方便。