《生物统计学》教案
第一章 统计数据的收集和整理
教学时间:2学时 教学方法:课堂板书讲授
教学目的:重点掌握样本特征数平均数、样本方差、标准差的概念和计算方法,掌
握数据类型及频数(率)分布,了解众数、中位数、变异系数。
讲授难点:样本方差、标准差的概念和计算方法
1.1 总体与样本
1.1.1 统计数据的不齐性
1、变异性是自然界存在的客观规律。
2、自然界如果没有变异,也就不需要统计学了。
3、生物学研究的对象都是很大的群体,不可能研究全部对象,只能通过研究其中的一部分,来推断全部对象,于是引出以下概念。 1.1.2 总体与样本
总体:研究的全部对象。 个体:总体中的每个成员。 样本:总体的一部分。
样本含量:样本所包含的个体数目。 1.1.3 抽样
抽样:从总体中获得样本的过程。
随机抽样:总体中的每一个个体被抽中的机会都相同的一种抽样方法。 放回式抽样:从总体中抽出一个个体,记下其特征后,放回原总体中,再做第二次抽样。
非放回式抽样:从总体中抽出个体后,不再放回,即做第二次抽样。 抽样的目的:从总体中获得一个有代表性的样本,以便通过样本推断总体。 应注意的问题:①样本必须有代表性。②样本含量与可实施性之间的平衡。 1.2 数据类型及频数(率)分布
1.2.1 连续型数据和离散型数据
连续型数据:与某种标准比较所得到的数据。又称为度量数据。
离散型数据:由记录不同类别个体的数目所得到的数据。又称为计数数据。 1.2.2 频数(率)分布表和频数(率)分布图的编绘
例1.1 调查每天出生的10名新生儿中体重超过3公斤的人数, 共调查120天,结果如下:
表 1-1 每10名新生儿中体重超过3Kg的人数的
频数(率)分布表
频数(率)分布:把频数(率)按组值的顺序排列起来,便得到离散型数据的频数(率)分布。
频数(率)分布还可以用图形表示,见图1-1。
图1-1 每10名新生儿中体重超过3Kg的人数的频数分布图
下面介绍连续型数据的频数(率)分布表和分布图的编绘方法。
例 1.2 表1-2列出了高粱“三尺三”提纯时所调查的100个数据。
表1-2 “ 三尺三”株高测量结果
155 153 159 155 150 159 157 159 151 152 159 158 153 153 144 156 150 157 160 150 150 150 160 156 160 155 160 151 157 155 159 161 156 141 156 145 156 153 158 161 157 149 153 153 155 162 154 152 162 155 161 159 161 156 162 151 152 154 157 162 158 155 153 151 157 156 153 147 158 155 148 163 156 163 154 158 152 163 158 154 164 155 156 158 164 148 164 154 157 165 158 166 154 154 157 167 157 159 170 158
从上表中除可以看出最大值为170,最小值为141,以及平均高度大约在150-160之外,很难再看出什么规律出来。但将以上数据列成频数分布表以后,便可以清楚地看出数据的变化规律。
表1-3 “三尺三”株高频数(率)分布表
频数(率)分布:把频数(率)按组界的顺序排列起来,便得到了连续型数据的频数(率)分布。
从频数分布表中可见到的规律性:
1、植株矮的频数低,植株高的频数也低,植株中等高度的频数最高。
2、频数分布基本是两侧对称的。
3、植株平均高度在156-158厘米范围内。 编制连续型数据频数(率)分布表的要点:
1、求出极差R,R = max x – min x,根据极差决定划分的组数,一般以10 – 15组为宜。
2、根据极差和组数求出组距,按照组距划分组限。组限是按实验记录数据划分的每一组的上下限。
3、确定组界,组界是每一组实际值的上下界。 4、计算中值,中值是每一组组限的平均值。
5、以唱票的方式把原始数据添入相应的组限内,统计出每组的频数并计算出相应的频率。
连续型数据的频率分布同样可以用频数(率)分布图表示。下面是频数(率)分布的直方图。
图1-2 “三尺三”株高直方图
横轴表明组界,纵轴标明频数(率),以每一组的组界为一边,相应的频数(率)为另一边,作成连续的矩形,构成直方图。
连续型数据的频数(率)分布还可以用多边形图表示。
图1-3 “三尺三”株高多边形图
横轴为中值,纵轴为频数(率),标上各点,连接各点构成多边形图。
第三种频数(率)图是累积频数图。首先编制出累积频数(率)表。再以横轴为中值,纵轴为频数(率)绘图。
表1-4 “三尺三”株高的累计频数分布表
中值 142 145 148 151 154 累积频数(率) 1 3 7 20 43
中值 157 160 163 166 169 累积频数(率) 71 86 96 99 100 图1-4 “三尺三”株高累计频数分布图