第 18 章 Logistic 回归思考与练习参考答案
一、最佳选择题
1. Logistic回归与多重线性回归比较, ( A )。A.logistic 回归的因变量为二分类变量B.多重线性回归的因变量为二分类变量
C.logistic 回归和多重线性回归的因变量都可为二分类变量D.logistic 回归的自变量必须是二分类变量E.多重线性回归的自变量必须是二分类变量
2. Logistic回归适用于因变量为(E )。
A.二分类变量B.多分类有序变量C.多分类无序变量
D.连续型定量变量
E
. A、 B、C 均可
3. Logistic
回归系数与优势比
OR的关系为E
(
)。
A.β
0 等价于 OR> 1
B
. β
0 等价于 OR< 1
C
.β=0 等价于
OR= 1
D
.
< 0 等价于
OR< 1 E 回
. A、 C、 D 均正确
4. Logistic 归可用于(
E
)。
B
A.影响因素分析
.校正混杂因素
C
.预测
D.仅有 A 和 C
E . A、 B、C 均可
5. Logistic 回归中自变量如为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛
选时可用(
D
)。
A.软件自动筛选的前进法
B .软件自动筛选的后退法
C.软件自动筛选的逐步法
D .应将几个哑变量作为一个因素,整体进出回归方程
E.A、 B、 C 均可
二、思考题
1. 为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中
学校,各选择初一年级一个班的全部学生进行调查,并用
logistic 回归方程筛选影响因素。
试问上述问题采用
logistic 回归是否妥当
答:上述问题采用 logistic 回归不妥当,因为 logistic 回归中参数的极大似然估计要
β
求样本结局事件相互独立,而研究的问题中低龄青少年吸烟行为不独立。
2. 分类变量赋值不同对 logistic 回归有何影响 分析结果一致吗
回归方程的参数估计绝对值相等,符号相反;
答:( 1)若因变量交换赋值,两个 logistic
优势比互为倒数,含义有所区别,实质意义一样;模型拟合检验与回归系数的假设检验结果
相同。
( 2)若改变自变量参照类或哑变量设置方法,
logistic 回归方程形式、参数含义虽有不
同,但是模型实质与应用结果相同,可以根据研究需要选择不同赋值方法。
Logistic 回归结
果报告中,一定要说明分类变量赋值方法及其参照,否则无法理解模型意义。
3. 例 18-6 研究性别对吸烟行为的影响,采用
logistic
回归校正了年龄对居民吸烟行为的影
响,请考虑有无其他混杂因素需要校正
答:例 18-6 的主要目的是研究吸烟行为与性别的联系及其强度,例题采用
logistic
回
归只校正了年龄对居民吸烟行为的影响。事实上,除年龄外,仍有其他因素会影响吸烟行为与性别的联系强度,如家庭人均年收入、受教育程度、主动获取保健知识等。建立回归模型
时,首先应根据专业知识确定可能的影响因素,再采用
logistic 回归,将性别作为强制引入
变量,对其他可能的影响因素进行变量筛选,最后将性别与筛选出的因素作为自变量建立 logistic 回归方程,从而正确回答校正混杂因素后吸烟行为与性别的联系及其强度。
4. 配对病例 - 对照研究资料若采用非条件logistic 回归进行分析,对结果有何影响答:采用
配对(匹配)方法的目的是对可能的混杂因素加以控制,有助于提高研究效率
和可靠性。配对设计的特点是对子内部控制的混杂变量一致,有较好的可比性。配对(匹配)
资料若采用非条件
logistic 回归进行分析,则忽视了这种可比性,降低了分析方法的检验效
能。
三、计算题
探讨肾细胞癌转移有关的因素研究中,收集了
26 例行根治性肾切除术患者的肾癌标本资
料(教材表 18-19 ),有关变量说明如下,试进行 logistic
回归分析。
X1 :确诊时患者的年龄(岁) 。
X 2 :肾细胞癌血管内皮生长因子,其阳性表达由低到高共
3 个等级,分别赋值
1、2、3。
X 3 :肾细胞癌组织内微血管数。
X 4 :肾细胞癌细胞核组织学分级,由低到高共
4 级,分别赋值 1、 2、 3、4。
X 5 :肾细胞癌分期,由低到高共
4 期,分别赋值 1、 2、 3、4。 1,无转移= 0。
例行根治性肾切除术患者的肾癌标本资料
Y :肾细胞癌转移情况,有转移=
教材表 18-19 26
i
1 2 3 4 5 6 7 8 9 10 11 12 13
X 1
59 36 61 58 55 61 38 42 50 58 68 25 52
X 2
2 1 2 3 3 1 1 1 1 3 3 2 1
X 3 X 4
2 1 2 4 3 2 1 3 1 2 4 4 1
X 5
1 1 1 3 4 1 1 2 1 2 2 3 1
Y
0 0 0 1 1 0 0 0 0 0 0 1 0
i
14 15 16 17 18 19 20 21 22 23 24 25 26
X 1 X 2
31 36 42 14 32 35 70 65 45 68 31 58 60
2004。
X 3
X 4
2 3 2 3 2 2 4 4 2 3 2 4 4
X 5
1 1 1 3 3 1 3 4 4 3 3 3 3
Y
0 1 0 1 0 0 1 1 0 1 0 0 1
1 3 1 3 1 1 3 2 2 3 2 1 3
数据摘自 倪宗瓒 . 卫生统计学 4 版,人民卫生出版社,
解:
Variables in the Equation
B
X2 X4
SE
Wald
df
1 1 1
Sig. Exp(B)
Constant
–
Logistic 回归分析结果显示: 肾细胞癌转移与肾细胞癌血管内皮生长因子和肾细胞癌细胞 核组织学分级有关。肾细胞癌血管内皮生长因子
X 2 和肾细胞癌细胞核组织学分级 X 4 的回归
系数均为正值,说明两个变量取值越大,则肾细胞癌转移的危险性越大。在肾细胞癌细胞核 组织学分级不变条件下,肾细胞癌血管内皮生长因子每增加一级,肾细胞癌转移的优势增至
倍,增加倍;在肾细胞癌血管内皮生长因子不变条件下,肾细胞癌细胞核组织学分级每增加
一级,肾细胞癌转移的优势增至倍,增加倍。
(毛宗福 余红梅)