Logistic 回归分析报告结果解读分析
Logistic 回归常用于分析二分类因变量 (如存活和死亡、患病和未患病等 )与 多个自变量的关系。比较常用的情形是分析危险因素与是否发生某疾病相关联。 例如,若探讨胃癌的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃 癌组,两组人群有不同的临床表现和生活方式等, 因变量就为有或无胃癌, 即“是” 或“否”,为二分类变量,自变量包括年龄、性别、饮食习惯、是否幽门螺杆菌 感染等。自变量既可以是连续变量, 也可以为分类变量。 通过 Logistic 回归分析, 就可以大致了解胃癌的危险因素。
Logistic 回归与多元线性回归有很多相同之处,但最大的区别就在于他们的 因变量不同。多元线性回归的因变量为连续变量; Logistic 回归的因变量为二分 类变量或多分类变量,但二分类变量更常用,也更加容易解释。
1. Logistic 回归的用法
一般而言, Logistic 回归有两大用途, 首先是寻找危险因素, 如上文的例子, 找出与胃癌相关的危险因素;其次是用于预测,我们可以根据建立的 Logistic 回 归模型,预测在不同的自变量情况下,发生某病或某种情况的概率 分的建立 )。
2. 用Logistic回归估计危险度
(包括风险评
所谓相对危险度(risk ratio , RR)是用来描述某一因素不同状态发生疾病(或 其它结局 )危险程度的
比值。Logistic回归给出的OR(odds ratio)值与相对危险度类似,常用来表 示相对于某一人群, 另一人群发生终点事件的风险超出或减少的程度。 如不同性 别的
胃癌发生危险不同,通过Logistic回归可以求出危险度的具体数值,例如1.7,
这样就表示,男性发生胃癌的风险是女性的1.7倍。这里要注意估计的方向问题, 以女性作为参照,男性患胃癌的 OR是1.7。如果以男性作为参照,算出的 OR将 会是0.588(1/1.7),表示女性发生胃癌的风险是男性的 0.588倍,或者说,是男 性的58.8 %。撇开了参照组,相对危险度就没有意义了。
Logistic回归在医学研究中广泛使用的原因之一,就是模型直接给出具有临 床实际意义的OR值,很大程度上方便了结果的解读与推广。
RR 与 OR
Relative Risk (RR)
RR
?@+乃)
Pevent when non-exposed
c/(c+d)
Odds Ratio (OR)
nn -內/(1 一血)_d/b _ ad ~ ?2/(l-p2)— c/d — be
>发病率较小时,OR q RR
RR =——
c、
1-RC+(RCXOR)
Rc: absolute risk in rhe micxposed group Considering Rc is small, and OR is near 1 ..........
图1相对危险度(risk ratio ,RR)与OR(odds ratio) 的表达
3. Logistic 报告OR值或B值
在Logistic回归结果汇报时,往往会遇到这样一个问题:是应该报告 OR值, 还