好文档 - 专业文书写作范文服务资料分享网站

生物医学研究的统计学方法_课后习题解答

天下 分享 时间: 加入收藏 我要投稿 点赞

C.简单线性回归的SS残差等于0 D.简单线性回归的SS残差等于SS总 E.简单线性回归的SS总等于0

5.用最小二乘法确定直线回归方程的含义是( B )。

A.各观测点距直线的纵向距离相等 B.各观测点距直线的纵向距离平方和最小 C.各观测点距直线的垂直距离相等 D.各观测点距直线的垂直距离平方和最小 E.各观测点距直线的纵向距离等于零

二、思考题

1.简述简单线性回归分析的基本步骤。

答:① 绘制散点图,考察是否有线性趋势及可疑的异常点;② 估计回归系数;③ 对总体回归系数或回归方程进行假设检验;④ 列出回归方程,绘制回归直线;⑤ 统计应用。 2.简述线性回归分析与线性相关的区别与联系。

答:区别:

(1)资料要求上,进行直线回归分析的两变量,若X为可精确测量和严格控制的变量,则对应于每个X的Y值要求服从正态分布;若X、Y都是随机变量,则要求X、Y服从双变量正态分布。直线相关分析只适用于双变量正态分布资料。

(2)应用上,说明两变量线性依存的数量关系用回归(定量分析),说明两变量的相关关系用相关(定性分析)。

(3)两个系数的意义不同。r说明具有直线关系的两变量间相互关系的方向与密切程度,b表示X每变化一个单位所导致Y的平均变化量。

(4)两个系数的取值范围不同:-1≤r≤1,???b??。 (5)两个系数的单位不同:r没有单位,b有单位。 联系:

(1)对同一双变量资料,回归系数b与相关系数r的正负号一致。b>0时,r>0,均表示两变量X、Y同向变化;b<0时,r<0,均表示两变量X、Y反向变化。

(2)回归系数b与相关系数r的假设检验等价,即对同一双变量资料,tb?tr。由于相关系数r的假设检验较回归系数b的假设检验简单,故在实际应用中常以r的假设检验代替b的假设检验。

(3)用回归解释相关:由于决定系数R=SS回 /SS总 ,当总平方和固定时,回归平方和的大小决定了相关的密切程度。回归平方和越接近总平方和,则R越接近1,说明引入相关的效果越好。例如当r=0.20,n=100时,可按检验水准0.05拒绝H0,接受H1,认为两变量有相关关系。但R=(0.20)2=0.04,表示回归平方和在总平方和中仅占4%,说明两变量间

222

的相关关系实际意义不大。

3. 决定系数与相关系数的意义相同吗?如果不一样,两者关系如何?

答:现将相关系数、决定系数与Y的总变异的关系阐释如下:假如在一回归分析中,回归系数的变异数SS回归=9,而Y的总变异数SS总=13,则

决定系数R =SS回归 / SS总=9/14=0.642 9/1,相关系数R=0.801 8

即将决定系数表示为一比值关系,当SS总= l时,则SS回归= 0.642 9,我们可以采用直角三角形的“勾股定理”图示决定系数与相关系数的关系,如练习图10-1所示。

2三、计算题 SS回归 SS回归 练习图10-1 相关系数、决定系数与总变异的关系 面积=0.642 9 面积=9 SS残差 边长=0.801 8 边长=3 面积=4 SS残差 边长=2 1. 以例10-1中空气一氧化氮(NO)为因变量,风速(X4)为自变量,采用统计软件完成如下分析: SS回归 SS残差 SS回归 SS残差 (1)试用简单线性回归方程来描述空气中NO浓度与风速之间的关系。 =0.642 9 =0.357 1 =9 =4 ? (2)对回归方程和回归系数分别进行假设检验。SS总=1 SS总=13 (3)绘制回归直线图。 (4)根据以上的计算结果,进一步求其总体回归系数的95%置信区间。 (5)风速为1.50 m/s时,分别计算个体Y值的95%容许区间和Y的总体均数的95%置信区间,并说明两者的意义。

解:运用SPSS进行处理,主要分析结果如下:

(1)简单线性回归方程、假设检验结果及总体回归系数的95%置信区间如下: Coefficients(a) Unstandardized Standardized 95% Confidence Interval for B Coefficients Coefficients t Sig. B Std. Error Beta Lower Bound Upper Bound Constant 0.159 0.019 0.000 0.120 0.198 8.422 -0.053 0.012 -0.680 -4.345 0.000 -0.078 -0.028 风速 (2)方差分析结果:

ANOVA(b) Regression Residual Total Sum of Squares 0.038 0.044 0.081 df 1 22 23 Mean Square 0.038 0.002 F 18.878 Sig. 0.000(a) (3)回归直线如练习图10-2。

练习图10-2 回归直线图

?)与2. 教材表10-8为本章例10-1回归分析的部分结果,依次为X、Y、Y的估计值(Y?与X、Y与Y?、Y与残差(e),请以相关分析考察四者之间的关系,以回归分析考察Y?、Y?Y?与X之间的关系,并予以解释。 Y?Y教材表10-8 案例分析中回归分析的部分结果

X Y ? Y? X Y Y?Y? Y? Y?YX Y ? Y? Y?Y1.30 0.07 0.070 7 -0.004 7 1.20 0.10 0.054 8 1.44 0.08 0.093 5 -0.017 5 1.48 0.13 0.098 6 0.045 2 1.12 0.04 0.041 5 -0.002 5 0.030 4 1.66 0.06 0.127 1 -0.068 1 0.79 0.00 -0.010 8 0.011 8 1.82 0.14 0.153 1 -0.018 1 1.54 0.09 0.108 1 -0.021 1 1.65 0.17 0.126 5 0.043 5 1.44 0.10 0.092 2 0.006 8 0.96 0.04 0.016 8 0.022 2 1.76 0.16 0.142 9 0.013 1 0.95 0.01 0.014 9 -0.009 9 1.78 0.22 0.147 4 0.074 6 1.75 0.12 0.142 6 -0.022 6 1.44 0.01 0.092 9 -0.081 9 1.50 0.15 0.101 7 0.043 3 1.20 0.04 0.054 8 -0.014 8 1.08 0.00 0.036 5 -0.033 5 1.06 0.03 0.032 7 -0.003 7 1.50 0.12 0.102 4 0.017 6 1.84 0.14 0.156 9 -0.016 9 1.44 0.10 0.092 2 0.006 8 解:主要分析结果:

(1)四者之间的相关系数 Correlations

X

1 0.809 1.000 0.000

Y

0.809

1 0.809 0.586

Yhat

1.000 0.809

1 0.000

Y?Yhat

0.000 0.586 0.000 1

X Y Yhat Y?Yhat

** Correlation is significant at the 0.01 level (2-tailed).

(2)四个变量间的回归系数 因变量

自变量

截距 -0.136 1.005 0.088

回归系数 0.159 0.001 0.999

t 456.016 6.457 3.394 0.000

P

0.000 0.000 0.003 1.000

? YY

X

? YY

? Y?YX

? Y?Y0.000 014 7 0.000 010 5

?与X呈完全正相关关系,回归系数t 检验结果P =0.000,表明Y?的变异可由X 完Y全解释。

?的相关系数与Y与X 的相关系数相同,表明正是由于X 的影响引起Y的变Y与Y?关系即体现了Y与X的变化关系。 异,Y与Y?体现了扣除X的影响后,Y与残差仍呈正相关关系。 Y与Y?Y?与X呈零相关关系,表明扣除了X的影响,回归方程的残差与X不再有相关或Y?Y回归关系。

(张岩波 郝元涛)

第11章 多重线性回归分析

思考与练习参考答案

一、 最佳选择题

1. 逐步回归分析中,若增加自变量的个数,则( D )。

A. 回归平方和与残差平方和均增大 B. 回归平方和与残差平方和均减小 C. 总平方和与回归平方和均增大 D. 回归平方和增大,残差平方和减小 E. 总平方和与回归平方和均减小

2. 下面关于自变量筛选的统计学标准中错误的是( E )。

A. 残差平方和(SS残差)缩小 B. 确定系数(R)增大

2C. 残差的均方(MS残差)缩小 D. 调整确定系数(Rad)增大

2E. Cp统计量增大

3. 多重线性回归分析中,能直接反映自变量解释因变量变异百分比的指标为 ( C )。

A. 复相关系数 B. 简单相关系数 C.确定系数 D. 偏回归系数 E. 偏相关系数 4. 多重线性回归分析中的共线性是指( E )。

A.Y关于各个自变量的回归系数相同 B.Y关于各个自变量的回归系数与截距都相同

C.Y变量与各个自变量的相关系数相同 D.Y与自变量间有较高的复相关 E. 自变量间有较高的相关性

5. 多重线性回归分析中,若对某一自变量的值加上一个不为零的常数K,则有( D )。

A. 截距和该偏回归系数值均不变 B. 该偏回归系数值为原有偏回归系数值的

K倍

C. 该偏回归系数值会改变,但无规律 D. 截距改变,但所有偏回归系数值均不改变 E. 所有偏回归系数值均不会改变

二、思考题

1. 多重线性回归分析的用途有哪些?

答:多重线性回归在生物医学研究中有广泛的应用,归纳起来,可以包括以下几个方面:定量地建立一个反应变量与多个解释变量之间的线性关系,筛选危险因素,通过较易测量的变量估计不易测量的变量,通过解释变量预测反应变量,通过反应变量控制解释变量。

2. 多重线性回归模型中偏回归系数的含义是什么?

答:偏回归系数的含义是:在控制其他自变量的水平不变的情况下,该自变量每改变一个单位,反应变量平均改变的单位数。

3. 请解释用于多重线性回归参数估计的最小二乘法的含义。 答:最小二乘法的含义是:残差的平方和达到最小。 4. 如何判断和处理多重共线性?

答:如果自变量之间存在较强的相关,则存在多重共线性。可以通过分析自变量之间的相关系数、计算方差膨胀因子和容忍度等指标判断是否存在多重共线性。如果自变量间存在多重共线性,最简单的处理办法是删除变量,即在相关性较强的变量中删除测量误差大的、缺失数据多的、从专业上看意义不是很重要的或者在其他方面不太满意的变量。其次,也可采用主成分回归方法。

5. 如何判断、分析自变量间的交互作用?

答:基于专业背景知识,构造可能的交互作用项,并检验交互作用项是否有统计学意义。 6. 多重线性回归模型的基本假定有哪些?如何判断资料是否满足这些假定?如果资料不满足假定条件,常用的处理方法有哪些?

答:多重线性回归的前提条件是线性、独立性、正态性和等方差性,可以借助残差分析

生物医学研究的统计学方法_课后习题解答

C.简单线性回归的SS残差等于0D.简单线性回归的SS残差等于SS总E.简单线性回归的SS总等于05.用最小二乘法确定直线回归方程的含义是(B)。A.各观测点距直线的纵向距离相等B.各观测点距直线的纵向距离平方和最小C.各观测点距直线的垂直距离相等D.各观测点距直线的垂直距离平方和最小E.各
推荐度:
点击下载文档文档为doc格式
42xnj0pgih6rgfk15sw18xzko02xvg00fw1
领取福利

微信扫码领取福利

微信扫码分享