第六章 样本及抽样分布
【基本要求】 1、理解总体、个体和样本的概念;
2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。
【本章重点】 样本均值、样本方差和样本矩的计算;抽样分布——
2
分布, t 分布,
F 分布;分位数的理解和计算。
【本章难点】 对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时
【授课内容】
§ 6.0前言
前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象) 。其研究方法是归纳法(部分到整体) 。对研究对象的客 观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
§ 6.1 随机样本
1
一、总体与样本
1. 总体、个体
在数理统计学中,我们把所研究的全部元素组成的集合称为
总体;而把组成总体的每个元素
称为个体。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是
个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每
个男大学生就是个体。
但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几
项数量指标 X ( 可以是向量 ) 和该数量指标 X在总体的分布情况。 在上述例子中 X 是表示灯泡的寿
命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了
X 的这样或那样的数值, 因而这个数量指标 X 是一个随机变量(或向量) ,而 X 的分布就完全描写了总体中我们所关心的
那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和
数量指
标 X 可能取值的全体组成的集合 等同起来。
定义 1:把研究对象的全体(通常为数量指标
X 可能取值的全体组成的集合)称为 总体;总体中
的每个元素称为 个体。
我们对总体的研究, 就是对相应的随机变量 X 的分布的研究, 所谓总体的分布也就是数量指
标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。
例 1:考察一块试验田中小麦穗的重量:
X =所有小麦穗重量的全体(无限总体) ;个体——每个麦穗重 x
2
对应的分布: F ( x) P{
x}
重量 x的麦穗数
1
( t ) 2 dt ~ N ( , 2 ) 0 x
x
总麦穗数 2
例 2:考察一位射手的射击情况:
X =此射手反复地无限次射下去所有射击结果全体;每次射击结果都是一个个体(对应于靶上的一点)
个体数量化 x
1 射中 0 未中
1 在总体中的比例 p 为命中率
0 在总体中的比例 1
p 为非命中率
总体 X 由无数个 0,1 构成,其分布为两点分布
B(1, p) P{ X 1} p, P{ X 0} 1 p
2. 样本与样本空间
为了对总体的分布进行各种研究,就必需对总体进行抽样观察。
抽样——从总体中按照一定的规则抽出一部分个体的行动。
一般地,我们都是从总体中抽取一部分个体进行观察,然后根据观察所得数据来推断总体的
性质。按照一定规则从总体 X 中抽取的一组个体 ( X1 , X 2 , , X n ) 称为总体的一个样本,显然,样 本为一随机向量。
为了能更多更好的得到总体的信息,需要进行多次重复、独立的抽样观察(一般进行
n 次),
若对抽样要求 ①代表性 :每个个体被抽到的机会一样,保证了
X 1 , X 2 , , X n 的分布相同,与总体 一样。 ②独立性 : X1 , X 2 , , X n 相互独立。那么,符合“代表性”和“独立性”要求的样本
( X 1 , X2 , , X n ) 称为简单随机样本 。易知,对有限总体而言, 有放回的随机样本为简单随机样本, 无放回的抽样不能保证 X 1 , X 2 , , X n 的独立性;但对无限总体而言,无放回随机抽样也得到简单 随机样本,我们本书则主要研究 简单随机样本 。
3
对每一次观察都得到一组数据 ( x1 , x2 , , xn ),由于抽样是随机的, 所以观察值( x1, x2 , ,
xn )
也是随机的。为此,给出如下定义:
定义 2: 设总体 X 的分布函数为 F ( x) ,若 X 1 , X 2 , , X n 是具有同一分布函数 F ( x) 的相互独立的随
机变量,则称( X 1, X 2 , , X n )为从总体 X 中得到的容量为 n 的简单随机样本,简称样本。把它 们的观察值( x1 , x2 , , xn )称为样本值。
定义 3: 把样本 ( X1 , X 2 , , X n ) 的所有可能取值构成的集合称为 样本空间 , 显然一个样本值 ( x1 , x2 , , xn ) 是样本空间的一个点。
注:样本具有双重性 ,在理论上是随机变量,在具体问题中是数据。
二、样本的分布:
设总体 X 的分布函数为 F (x) ,( X 1, X 2 , , X n )是 X 的一个样本,则其联合分布函数为:
n
F * ( x1 ,x2 , , xn ) =
i 1
F (xi ) 。
例 3:设总体 X ~ B(1, p) , ( X1 , X 2 , X n ) 为其一个简单随机样本,则样本空间 {( x1 , x2 , ,xn ) xi 0,1 ; i
1,2, ,n } ,因为 P{ X x} px (1 p)1 x , x 0,1
所以样本的联合分布列为:
P{ X1 x1 , X 2 x2 ,L , Xn xn } P{ X1
p (1 p)
x1} P{ X 2 x2} L P{ X n p (1
xn } 0,1
x1
1 x1
.p(1p) 2 x1 x2 xn
p)
1 x
n
x
i
i 1,2, , n
4
§6.2
抽样分布
0、引言
有了总体和样本的概念,能否直接利用样本来对总体进行推断呢?一般来说是不能的,需要
根据研究对象的不同,构造出样本的各种不同函数,然后利用这些函数对总体的性质进行统计推
断,为此,我们首先介绍数理统计的另一重要概念——统计量。
一、统计量 (随机变量)
定义 1:设 ( X 1 , X 2 ,L , X n ) 是来自总体 X 的一个样本, g( X 1 , X 2 ,L , X n ) 是样本的函数, 若 g 中
不含任何未知参数 ,则称 g ( X1 , X 2 , , X n ) 是一个统计量 。
设 ( x1 , x2 ,L , xn ) 是对应于样本 ( X 1 , X 2 ,L , X n ) 的样本值,则称 g( x1 , x2 ,L , xn ) 是 g( X 1 , X 2 ,L , X n ) 的观察值。
下面列出几个常用的统计量。
1、样本均值与样本方差 (随机变量)
定义 2 设( X1,X 2 , , X n )是来自总体 X 的一个样本,称 X
n
n
1 n i
n
n
X i 为样本均值 。
1
S2 1 ( X i X)2[
n 1 i 1
n
1 ( X i 2
n 1 i 1
2XX i X 2 )
1 ( Xi
n 1 i 1
2 2nX 2 nX 2 )
1 ( X i 2 nX 2 )] 为样本方差 。 n 1 i 1
SS2 1
n
n 1 i 1
( X i X ) 2 为样本标准差 。 样本均值与样本方差分别刻划了 样本的位置特征 及样本的分散性特征 。 2. 样本矩(r.v )