公共卫生学院
ys 卫生统计学
⑶若各组间的率出现明显交叉时,不宜采用标准化法比较,可直接比较各组的率;
⑷两样本标化率的比较应作假设检验。 第六章 总体均数和总体率的估计
1、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可避免、可以控制。表现:样本统计量与总体参数之间的差异样本统计量之间的差异。产生原因:个体变异+抽样。 2、标准误:样本统计量的标准差称为标准误;样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度 : ??X?n 总体标准差未知时,用样本标准差代替: SSX?n★3、标准差与标准误的区别:
⑴标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明
抽样误差的大小。 ⑵标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标
准误用于总体均数的区间估计和假设检验。 4、t分布的特征:
⑴以0为中心,左右对称;
⑵自由度ν 越小,t值越分散,曲线越平阔,尾部越高; ⑶当ν 趋于∞时, t分布逼近标准正态分布; ⑷t分布曲线下面积为1. 5、从界值表可看出:
(1)自由度ν 相同时,t界值越大其对应的P值越小 (2)概率P(或尾部面积)相等时,ν 越大,t 界值越小 (3)t 值相等时,双侧概率为单侧概率的两倍 (4) ν = ∞ 时,t 界值即为z 界值 6、总体均数可信区间的计算: z分布法:
x??z??n
6
公共卫生学院
ys 卫生统计学
⑴当σ已知, 服从标准正态分布 ,则N(0,1)总体均数的双测
?2xx?z?,x?z???可信区间为: ?2x⑵?未知但n足够大(n>50): t分布法:当σ未知n 较小 7、常用单双侧u值 α 0.10 0.05 0.02 0.01
:t ?x??x?z?2,?Sx,x?t?2,?Sx??2xS,x?z?2Sx? 单侧 1.282 1.645 2.054 2.326
双侧 1.645 1.960 2.326 2.578
8、可信区间的涵义:从总体中作随机抽样,每个样本可以算得一个可信区间。
如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。
可信区间的两个要素:一是准确度: 反映在可信度的大小
二是精密度: 反映在区间的长度
第七章 假设检验
★1、假设检验的基本思想:应用反证法和小概率原理,先对总体的参数或分
布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。 ★2、假设检验的基本步骤:
⑴建立检验假设,确定检验水准 ⑵选定检验方法和计算检验统计量 ⑶确定P值,作出推断结论 ★3、Ⅰ型错误与Ⅱ型错误:
Ⅰ型错误:拒绝了实际上成立的 ,犯“弃真”的错误。其概率大
小用? 表示,? 可取单侧亦可取双侧。
7
公共卫生学院
ys 卫生统计学
Ⅱ型错误:不拒绝了实际上不成立的H0,犯“存伪”的错误。其概率大
小用β表示。? 只取单侧,其大小一般未知,只有在已知两总体差值?,? 及 n 时,才能估算出来。 推断结论与两类错误
检验结果
拒绝H
0实际情况 成立 不成立
不拒绝H
0第一类错误(α) 结论正确(1-β)
结论正确(1-α) 第二类错误(β)
注:当样本含量固定时,α增大,β减小;反之亦然。
若欲同时减小α与β,则只有增加样本含量。
若重点减小Ⅰ型错误,α可取小一些,如α=0.01; 若重点减小Ⅱ型错误,α可取大一些,如α=0.1或α=0.2
★4、检验效能:若两总体确有差别,按照α水准能够发现这种差别的能力。
它的大小用(1-β)表示。 检验效能的影响因素:容许误差 δ、总体标准差 σ、Ⅰ型错误 α、样本含量n
★5、假设检验应注意的事项:
⑴ 应有严密的研究设计:总体中的每个研究个体应具有同质性、样本的获取必须遵循随机化原则、比较的组间应具有可比性。 ⑵ 正确理解α水准和P值的意义:α是人为预先设定的一个概率值,可有多个 ; P是假定H0 成立,得到实际观测数据的可能性的大小 ,一个样本按某一方法只能得出一个。 ⑶ 正确理解结论的统计学意义 。 ⑷ 假设检验的结论不能绝对化。
第八章 t检验 ★1、t 检验的适用条件:
⑴σ 未知; ⑵ n 较小(n<60);⑶样本来自正态总体;
8
公共卫生学院
ys 卫生统计学
22⑷两样本所来自的总体方差齐,即 σ1=σ22、配对设计主要情况:(看书本例题)
①配对的两个受试对象分别接受两种处理
②同一样品用两种不同方法测量同一指标, 或接受不同处理 ③同一受试对象处理前后的结果进比较 ④同一对象的两个部位给予不同的处理
步骤:①建立检验假设,确定检验水准(差值的总体均数)
??:0.05??0?:? 0HH
0d1
dx??0 ②计算检验统计量 ν =n-1 t?S/n ③确定P值,作出统计推断 3、两样本均数的比较:(看书本例题) ⑴步骤:
①建立检验假设,确定检验水准
: : H?1??2H1?1??2??0.050 ②计算检验统计量 x1-x2ν=n1+n2-2t?11 S2c(?)n1n2③确定P值,作出统计推断 ⑵两独立样本资料的t 检验,又称成组t 检验,适用于完全随机设计的两
样本均数的比较。 第九章 方差分析
1、方差分析的基本思想:根据资料的设计类型(即变异的不同来源),将全部观察值之间的变异(总变异)分解为两个或多个部分,除随机误差外其余每个部分的变异都可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,以了解某因素对观察指标是否有影响或某因素是否有效应。 ★2、方差分析的应用条件 :
⑴各样本须是相互独立的随机样本(独立性) ⑵各样本来自正态分布总体(正态性) ⑶ 各总体方差相等(方差齐性)
9
公共卫生学院
ys 卫生统计学
3、完全随机设计:又称成组设计。在实验研究中,按随机化原则将受试对象随机分配到某一研究因素的多个水平中去,然后观察实验效应;在调查研究中,按一个研究因素的不同水平分组,比较各组的效应。目的都是推断不同水平下各组均数之间的差别是否有统计学意义。 注:方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一
资料所得结果与t 检验等价,即F = t 2。 4、随机区组设计:又称配伍组设计,是配对设计的扩展。其设计方法是将全部受试对象按某种或某些特征分为若干个区组,使每个区组内研究对象的特征尽可能接近,然后分别使每个区组内的观察对象随机地接受研究因素某一水平的处理。 随机区组设计的方差分析:总变异= 处理组间变异+区组间变异+误差; 和完全随机设计的方差分析相比,误差减小了,检验效率提高了。 5、多个样本均数的两两比较:
⑴SNK-q检验,适用于探索性研究,对任意两个样本均数都进行检验。 ⑵LSD-t检验,最小显著性差异检验,适用于某一对或某几对在专业上有
特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段确定哪些均数需进行多重比较。 第十章 ?2 检验 ★1、?2 检验主要用途:
⑴推断两个或两个以上总体率(或构成比)之间有无差别 ⑵两变量间有无相关关系(有无关联) ⑶检验频数分布的拟合优度 2、2×2表的卡方检验(会列表) ⑴完全随机设计?2 检验的注意事项: 当 n>40 且所有 T?5 时:
(A?T)22 基本公式为: ??T 专用公式为: (ad?bc)2n2??(a?b)(c?d)(a?c)(b?d)当 n?40 但有 1?T<5 时:
?(|A?T|?0.5) 校正的基本公式为:
?2?T2 校正的基本公式为: (|ad?bc|?n/2)n2?2??(a?b)(c?d)(a?c)(b?d)10