1.单样本的非参数检验 (1)卡方检验
分析步骤
? 第1 步 提出零假设:卡方检验的零假设H0是“总体服从某种理论分布”,其对立假设H1是“总体不服从某种理论分布”。 ? 第2步 选择检验统计量:卡方分布选择的是Pearson卡方统计量。已证明,当n充分大时,它近似地服从自由度为k-1的卡方分布。
? 第3步 计算检验统计量的观测值和概率p值。 ? 第4步 给出显著性水平,作出决策。 实例:
某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的
??0.05) 五个工作日中?(
工作日 次品数
1 25 2 15 3 8 4 16 5 26 第1步 分析:由于考虑的是次品是否服从均匀分布的问题,考虑用卡方检验。
第2步 数据的组织:数据分成两列,一列是工作日,其变量名为“weekday”,另一列是次品数,变量名为“number”,输入数据并保存。
第3步 加权设置:将变量“number”定义为权变量。 第4步 进行卡方检验:
? 第5步 主要结果及分析
左表是频数分布情况表,第二列为实际观察值出现次数,第三列为理论上每天应出现的次数,第四列为残差
右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=0.014<0.05。说明应拒绝每个工作日出现的次品率相等的原假设。即次品数出现是不均匀的。
(2)二项分布检验
【例7-2】某地某一时期内出生35名婴儿,其中女性19名(定Sex=0),
男性16名(定Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为0.5)是否不同?
第1步 分析:由于性别分为男与女两种状态,故应用二项分布检验。 第2步 数据的组织:数据分成两列,其变量名为“性别”,“频数”。输入数据并保存。进行加权处理。 第3步 进行二项分布检验:
第4步 主要结果及分析
从上表可知,相伴概率Sig.=0.736>0.05,因此没有理由拒绝零假设。这说明此地新生儿男女比例与通常的男女比例相同。
2.两独立样本的非参数检验
【例7-3】 某公司希望了解两种品牌汽油A和B每加仑的行驶里程是否有区别,表7.15是两种品牌汽油每加仑的行驶里程数,在显著
性水平=0.05下,判断两个品牌间是否存在显著性差异? A B
第1步 分析:由于是两种品牌的汽油,可以认为是两个独立样本,但行驶里程数根本不知道服从何种分布,可用两独立样本的非参数检验进行分析。
第2步 数据组织:由于独立样本的非参数检验所检验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。
第3步 进行独立样本的非参数检验
30.4 28.7 29.2 32.5 31.7 29.5 30.8 31.1 30.7 31.8 33.5 29.8 30.1 31.4 33.8 30.9 31.3 29.6 32.8 33
双尾检验的相伴概率为0.151,大于0.05,说明两种汽油无显著性差异。
两个相伴概率都大于显著性水平0.05,因
此应接受零假设,认为两种汽油之间无显著性差异。
Kolmogorov-Smirnov Z值为0.894,相伴概率值为0.400,大于显著性水平0.05,因此应接受两种汽油之间无显著性差异的原假设;
根据游程检验计算的Z统计量为