据计算的秩和直接查表或计算相应的统计量再查表,确定P值下结论。进行有序资料的比较时宜采用秩和检验。
4. 试证明对于R×C式(8-11)与式(8-1)等价。
提示:
χ2???i?1j?1RCRC(Aij?Tij)2Tij2???i?1j?1RC(Aij?nimj/n)2nimj/n???ni?1j?1RAij?2Aijnimj/n?(nimj/n)2nimjAijAijAij2?n??(i?1j?1RCnimj2?2Aijn?nimjn2)?n(??i?1j?1RCCnimj2?2?1)?1)?n(??i?1j?1nimj三、计算题
1. 某医院观测了28例肝硬化患者和14例再生障碍性贫血患者血清中抗血小板抗体, 结果是:肝硬化患者中有2例阳性,再生障碍性贫血患者中有5例阳性。问:两类患者血清抗血小板抗体阳性率有无差别?
解:将资料进行整理列表(练习表8-1)。
练习表8-1 两类患者血清抗血小板抗体检测结果 患者类型 肝硬化患者 再生障碍性贫血患者
阳性 阴性 合计 2 26 28 5 9 14
资料属于独立的两组二分类资料比较。理论频数分别为4.67、23.33、2.33、11.67,应选用校正公式计算。假设H0:两种疾病患者血清抗血小板抗体检测阳性率相同,?=0.05。计算统计量校正卡方=3.621 4,自由度=1,P=0.057 0, 无统计学意义,尚不能认为两种疾病患者血清抗血小板抗体检测阳性率不同。
2. 对100名钩端螺旋体病患者同时用间接免疫抗体试验和显微镜凝集试验进行血清学诊断,结果见教材表8-18。试比较用两种方法检验的阳性率有无差别?
教材表8-18 两种方法的检验结果比较(例数)
间接免疫 荧光 + - 合计
+ 66 6 72
显微镜凝集
合计
- 11 17 28
77 23 100
解: 答案提示,本资料属于配对的两组二分类资料比较,b+c=11+6=17<40,应选用校正配对卡方公式计算。假设H0:两种方法检测的阳性率相同,计算统计量χ2? ?=0.05。0.9412,df=1,P=0.332,无统计学意义,尚不能认为两种方法检测的阳性率不同。 3. 研究两种不同的治疗训练方案对肥胖症患者的减肥效果情况,结果见教材表8-19。问这两种治疗训练方案对肥胖症患者的减肥效果是否相同?
教材表8-19 两种治疗训练方案对肥胖症患者的减肥效果(例数) 治疗方案 甲 乙 合计
效果较好 16 28 44
效果一般 22 17 39
效果较差 8 5 13
合计 46 50 96
解:该资料属于结果变量为有序变量的定性资料,应选用秩和检验。假设H0:两种治疗方案对肥胖症患者的减肥效果相同,?=0.05。按照治疗效果由差到好编秩,计算秩和
T甲? 1974,统计量U=-2.064,P=0.039,有统计学意义,可以认为两种治疗方案的减
肥效果不同,由两组平均秩和看,甲组为1 974÷46=42.91,乙组为2 682÷50=53.64,因为编秩是由差到好,因此可认为乙治疗方案的效果好于甲治疗方案。
4. 比较三种中药方剂对骨质疏松症的治疗效果,结果见教材表8-20。三种方剂的治疗效果是否有差异?
教材表8-20 三种中药方剂对骨质疏松症的治疗效果(例数) 分组 A方剂 B方剂 C方剂
有效 18 12 11
无效 6 14 15
合计 24 26 26
合计 41 35 76
解:本题属于独立的多组二分类资料比较。假设H0:三种方剂对骨质疏松症的治疗效果相同,?=0.05。计算统计量χ2?6.3350,df=2,P=0.042,差别有统计学意义,
拒绝H0,接受H1,尚不能认为这三种方剂的治疗效果不相同。
(郭秀花 罗艳侠)
第9章 关联性分析 思考与练习参考答案
一、最佳选择题
1. 对简单相关系数作假设检验,t?t(v),统计结论为( B )。
A. 两变量不相关 B. 两变量有线性关系
C. 两变量无线性关系 D. 两变量不会是曲线关系,一定是线性关系 E. 上述说法都不准确
2. 计算积矩相关系数要求( C )。
A. Y是正态变量,X可以不满足正态的要求 B. X是正态变量,Y可以不满足正态的要求 C. 两变量都要求满足正态分布规律 D. 两变量只要是测量指标就行
E. Y是定量指标,X可以是任何类型的数据
3. 对两个分类变量的频数表资料作关联性分析,可用( C )。
A. 积矩相关 B.秩相关 C. 关联系数 D. 线性相关 E.以上均可
4. 由样本算得相关系数r,t检验结果为P<0.01,说明( D )。
A. 两变量之间有高度相关性 B. r来自高度相关的总体
C. r来自总体相关系数为0的总体 D. r来自总体相关系数不为0的总体 E. r来自总体相关系数大于0的总体
二、思考题
1. 1988年某地抽查0~7岁儿童营养不良患病情况如教材表9-10,某医师要想了解年龄与营养不良患病率是否有关,你认为应选用什么统计方法?为什么?
教材表9-10 1988年某地抽查0~7岁儿童营养不良患病情况 年龄/岁
0~
1~
2~
3~
4~
5~
6~7
患病人数 患病率/% 98 15.7 278 11.7 86 12.9 29 7.4 59 8.9 82 7.3 34 5.1
解:提示,用秩相关分析年龄与患病率的关系,因患病率资料一般不服从正态分布。 2. 请查找最近三年主题为相关分析或关联分析的已发表国内医学文献,至少认真阅读其中3篇(建议分别选取Pearson、Spearman相关分析和关联分析各1篇),找出其中不妥之处。 3. 在讲散点图时,我们曾提到分层应慎重,有可能出现分层分析与总体情况大相径庭的结果。请举一两个实例说明这种现象。 三、计算分析题
1. 某学校随机抽取18名学生,测定其智商(IQ)值,连同当年数学和语文两科总成绩如表教材9-11。试计算数学成绩与智商、语文成绩与智商以及数学与语文成绩的相关系数,并检验总体相关系数是否为零。能否认为数学好的原因是语文好,或者语文好的原因是数学好?
教材表9-11 18名学生的智商、数学成绩和语文成绩
编号 1 数学成绩X 语文成绩Y 智商得分Z
78 83 95
2 84 76 100 11 48 53 61
3 61 70 100 12 45 43 60
4 52 58 75 13 67 70 88
5 93 82 105 14 75 78 96
6 89 78 97 15 95 97 125
7 98 89 110 16 88 92 113
8 98 95 120 17 99 92 126
9 65 61 76 18 81 88 102
编号 10 数学成绩X 语文成绩Y 智商得分Z
73 75 92
解:提示,数学与智商的相关系数(Pearson)为0.918,语文与智商的相关系数为0.958,数学与语文的相关系数为0.932。各总体相关系数均不为0。
数学好或者语文好与智商有关系。不能认为数学好的原因是语文好,或者语文好的原因是数学好,两者之间不存在因果关系。
2. 将10份研究生院的入学申请书让两位老师排序,结果见教材表9-12。请问两人的排序是否相关?
教材表9-12 两位老师对10份入学申请书的排序
申请书编号
A老师的排序 B老师的排序
1 6 7
2 10 8
3 5 5
4 1 4
5 7 6
6 2 3
7 8 9
8 9 10
9 3 1
10 4 2
解:提示,Spearman相关系数为0.842,总体相关系数不为0(P=0.002),可以认为两人的排序相关。
3. 关于丈夫和妻子关节炎的患病率分析中,100对中年夫妇的患病情况见教材表9-13,试分析丈夫和妻子关节炎的患病有无关系。
教材表9-13 100对中年夫妇的患病情况
妻子患病情况
有病 无病 合计 丈夫患病情况
有病 16 24 40 无病 24 36 60 合计 40 60 100 2解:提示,运用交叉分类2×2列联表的关联分析,?2=0.00,χ0.05=3.84>0.00,在
α=0.05的水平下,不拒绝H0,尚不能认为中年夫妇中丈夫患关节炎和妻子患关节炎有关联。
(凌 莉 刘清海)
第10章 简单线性回归分析
思考与练习参考答案
二、最佳选择题
1.如果两样本的相关系数r1?r2,样本量n1?n2,那么( D )。
A. 回归系数b1?b2 B.回归系数b1?b2 C. 回归系数b1?b2 D.t统计量tb1?tr1 E. 以上均错
2.如果相关系数r=1,则一定有( C )。
A.SS总=SS残差 B.SS残差=SS回归
C.SS总=SS回归 D.SS总>SS回归 E.MS回归=MS残差
3.记?为总体相关系数,r为样本相关系数,b为样本回归系数,下列( D )正确。
A.?=0时,r=0 B.|r|>0时,b>0 C.r>0时,b<0 D.r<0时,b<0 E. |r|=1时,b=1
4.如果相关系数r=0,则一定有( D )。
A.简单线性回归的截距等于0 B.简单线性回归的截距等于Y或X