生物统计学教案(5)
生物统计学教案
第五章 统计推断
教学时间:5学时 教学方法:课堂板书讲授
教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,
了解二项分布的显著性检验。
讲授难点:一个、两个样本的差异显著性检验
统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。
参数估计:通过样本统计量估计总体参数。 5.1 单个样本的统计假设检验 5.1.1 一般原理及两种类型的错误
例: 已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。
1、假设:
H0: μ=μ0 或 H0: μ-μ0=0
HA: μ>μ0 μ<μ0 μ≠μ0 三种情况中的一种。 本例的μ0=10.00g,因此 H0: μ=10.00
HA: μ>10.00 或 μ<10.00或 μ≠10.00
2、小概率原理 小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。
从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从
N(10.00,0.402)中抽取的,标准化的样本平均数
39 / 17
生物统计学教案(5)
u?x??0??x?10.000.40nn服从N(0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即
P(U>u), P(U<-u), 以及P(|U|>u)的概率。如果得到的值很小,则
x抽自平均数
为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。
显著性检验:根据小概率原理建立起来的检验方法。
显著性水平:拒绝零假设时的概率值,记为α。通常采用α=0.05和α=0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。
3、临界值
例 从上述动物群体中抽出含量n=10的样本,计算出
x=10.23g,并已知
该批动物的总体平均数μ绝不会小于10.00g,规定的显著水平α=0.05。根据以上条件进行统计推断。
H0: μ=10.00 HA: μ>10.00 根据备择假设,为了得到出u值。
x落在上侧尾区的概率P(U > u),将x标准化,求
P(U >1.82)=0.03438,P < 0.05,拒绝H0,接受 HA。
u?x??0?n?10.23?10.00?1.820.4010在实际应用中,并不直接求出概率值,而是建立在α水平上H0的拒绝域。从
正态分布上侧临界值表中查出P(U > uα)= α时的uα值,U > uα的区域称为在α水平上的H0拒绝域,而U < uα的区域称为接受域。接受域的端点一般称为临界值。本例的u=1.82,从附表3可以查出u0.05=1.645, u > uα,落在拒绝域内,拒绝H0而接受HA。
4、单侧检验和双侧检验
上尾单侧检验:上例中的HA:μ>μ0,相应的拒绝域为U > uα。对应于HA:μ>μ0时的检验称为上尾单侧检验。
下尾单侧检验:对应于HA:μ<μ0时的检验称为下尾单侧检验。
40 / 17
生物统计学教案(5)
其拒绝域为U <-uα。
双侧检验:对应于HA:μ≠μ0时的检验称为双侧检验。双侧检验的拒绝域为|U| >uα/2 。
5、单侧检验和双侧检验的效率:在样本含量和显著水平相同的情况下,单侧检验的效率高于双侧检验。这是因为在做单侧检验
利用了已知有一侧是不可能这一条件,从而提高了它的辨别力。所以,在可能的条件下尽量做单侧检验。
例 上例已经计算出u =1.82,上尾单侧检验的临界值u9,0.05=1.645,u > uα
,结论是拒绝零假设。在做双侧检验时u仍然等于1.82,双侧检验的临界值为u9, 0.05/2
=1.96, |u| 6、两种类型的错误 (1)I型错误,犯I型错误的概率记为α α=P(I型错误)=P(拒绝H0|H0是正确的,μ=μ0) (2)II型错误,犯II型错误的概率记为β βμ1=P(II型错误)=P(接受H0|H0是错误的,μ=μ1) 例 继续上例,抽出n=10的样本, x=10.20g,检验假设 H0:μ=10.00g HA:μ >10.00g 标准化的样本平均数 u?10.20?10.00?1.580.4010临界值u0.05 =1.645,u < u0.05, P > 0.05。结论是不能拒绝H0。 以样本平均数表示的临界值,可由下式得出 1.645?x0?10.000.4010x0?10.208在下图中x0的位置已用竖线标出。犯I型错误的概率α,由竖线右侧μ0=10.00曲线下面积给出。犯II型错误的概率由竖线左侧μ1=10.30曲线下面积给出。 41 / 17 生物统计学教案(5) ?10.30????10.208?10.30??P?U?u???P?U??P?U??0.73??0.2327??0.40??10??犯II型错误的概率β10.30=0.2327。 从上图中可以看出 (1)当μ1越接近μ0时,犯II型错误的概率越大。 (2)降低犯I型错误的概率,必然增加犯II型错误的概率。 (3)为了同时降低犯两种错误的概率,必须增加样本含量。 7、关于两个概念的说明: (1)当P <α时,所得结论的正确表述应为:由样本平均数推断出的总体平均数μ与μ0之间的差异有统计学意义。即它们属于两个不同总体。习惯上称为“差异是显著的”。 (2)接受H0的更严密的说法应是:尚无足够理由拒绝H0。但习惯上采用接受H0和拒绝H0这种表达方法。 5.1.2 单个样本显著性检验的程序 (略) 5.1.3 在σ已知的情况下,单个平均数的显著性检验-u检验 检验程序如下: 1、假设从σ已知的正态或近似正态总体中抽出含量为n的样本。 42 / 17 生物统计学教案(5) 2、零假设 H0: μ=μ0 备择假设 HA: ① μ > μ0 ② μ < μ0 ③ μ ≠ μ0 3、显著性水平 在α=0.05水平上拒绝H0称为差异显著 在α=0.01水平上拒绝H0称为差异极显著 4、检验统计量 u?x??0?n5、相应于2中各备择假设之H0的拒绝域 ① u > uα ② u <-uα ③ |u| > uα/2 6、得出结论并给予解释 例 已知豌豆籽粒重量服从正态分布N(377.2,3.32)在改善栽培条件后,随 机抽取9粒,其籽粒平均重为379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量? 解 ① σ已知 ② 假设: H0: μ= 377.2 HA: μ > 377.2 ③ 显著性水平: α=0.05 ④ σ已知,使用u检验 u?x??0?n379.2?377.2??1.823.39⑤ H0的拒绝域:因HA:μ >μ0,故为上尾检验,当u >u0.05时拒绝H0 。u0.05=1.645。 ⑥ 结论: u > u0.05 , 即P < 0.05, 所以拒绝零假设。栽培条件的改善,显 著地提高了豌豆籽粒重量。 5.1.4 σ未知时平均数的显著性检验-t检验 43 / 17