______________________________________________________________________________________________________________
一元线性回归分析的应用
——以微生物生长与温度关系为例
摘要:一元线性回归预测法是分析一个因变量与一个自变量之间的线性关系的预测方法。应用最小二乘法确定直线,进而运用直线进行预测。本文运用一元线性回归分析的方法,构建模型并求出模型参数,对分析结果的显著性进行了假设检验,从而了微生物生长与温度间的关系。
关键词:一元线性回归分析;最小二乘法;假设检验;微生物;温度
回归分析是研究变量之间相关关系的统计学方法,它描述的是变量间不完全确定的关系。回归分析通过建立模型来研究变量间的这种关系,既可以用于分析和解释变量间的关系,又可用于预测和控制,进而广泛应用于自然科学、工程技术、经济管理等领域。本文尝试用一元线性回归分析方法为微生物生长与温度之间的关系建模,并对之后几年的情况进行分析和预测。
1 一元线性回归分析法原理
1.1 问题及其数学模型
一元线性回归分析主要应用于两个变量之间线性关系的研究,回归模型模型为Y??0??1x??,其中?0,?1为待定系数。实际问题中,通过观测得到n组数据(Xi,Yi)(i=1,2,…,n),它们满足模型yi??0??1xi??i(i=1,2,…,n)并且通常假定E(εi)=0,Var(εi)=σ2各εi相互独立且服从正态分布。回归分析就是根据样本观
?????察值寻求?0,?1的估计?0,?1,对于给定x值, 取Y??0??1x,作为E(Y)??0??1x的??估计,利用最小二乘法得到?0,?1的估计?0,?1,其中
精品资料
______________________________________________________________________________________________________________
??y?x????01??????n????xy?nxy?1?ii???i?1????n22??xi?nx????i?1?。
?1.2 相关系数
2上述回归方程存在一些计算相关系数。设LLxx=?(xi?x)?,称为关于xi?nxX的离XX??2i?1i?1defnn22差平方和;LL=?SL(x)(?x)?nxS总??(yi?y)称为关于Y的离差平方和,?xyi??yyy=xy?xxi?i称为总?n2defnn2n2i?1i?1i?1i?1关于X与Y的离差积和。
相关系数?r=??(x?x)(Y?Y)iii?1n?i?1n(xi?x)2?i?1n?LxyLxxLyy,0≤ | r |≤1。| r |=1时表示完
(Yi?Y)2全线性相关,| r |=0时表示不存在线性相关;0< | r |≤0.3为微弱相关,0.3< | r |≤0.5时为低度相关,0.5< | r |≤0.8为显著相关,0.8< | r |≤1为高度相关。 1.3 样本统计量的假设检验
从总体中随机抽取一个样本,根据样本的数据导出的线性回归方程由于受到抽样误差的影响,所确定的变量之间的线性关系是否显著,以及按照这个模型用给定的自变量X估计因变量Y是否有效,必须通过显著性检验才可以作出结论,通常所用的检验方法是F检验。
?~N(0,?2)Y????x??01线性回归模型,可知,当?1?0时,就认为Y与x之
间不存在线性回归关系,故需检验如下假设:H0:?1?0,H1:?1?0,S总??(yi?y)2i?1n=
?(yi?1ni?i)??y2??(yi?1ni?y)为总偏差平方和,令S回?2??(yi?1ni?y),S剩?2?(yi?1ni?i)2。?y当H0为真时,取统计量F?S回~F(1,n?2),由给定显著性水平α,查表得Fα(1,S剩(n?2)精品资料
______________________________________________________________________________________________________________
n-2),根据实验数据(x1,y1),(x2,y2),?,(xn,yn)计算F的值,若F> Fα(1,n-2)时,拒绝H0,表明回归效果显著;若F≤Fα(1,n-2),接受H0,此时回归效果不显著。
2 一元回归分析法的应用
2.1 分析实例
某微生物的生长天数与当年三月上旬平均气温的数据如表1所示,分析三月上旬平均温度与微生物生长之间的关系。
表1 三月上旬温度与微生物生长天数的情况表
年份 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
温度℃ 8.6 8.3 9.7 8.5 7.5 8.4 7.3 9.7 5.4 5.5
天数 3 5 3 1 4 4 5 2 7 5
2.2 分析结果
将数据输入SPSS中进行运算,选择线性回归分析。分析结果如表2所示。自变量是“温度”,因变量是“微生物生长天数”。
表2 全回归模式
Model R R Square Adjusted R Square
Std,Error of the Estimate
计算=1
1 0.771 0.595 0.544 1.167
精品资料
______________________________________________________________________________________________________________
表2中R为相关系数,R Square为相关系数的平方,即判定系数用来判定线性回归的拟合程度,用自变量解释因变量的变异程度(所占比例);Adjusted R Square为调整后的判定系数,Std,Error of the Estimate为估计标准误差。
表3 方差分析表
Model Sum of Squares
df Mean Square
F Sig
Regression 16.003 1 16.003 11.478 0.009
Residual 10.897 8 1.362
Total 26.900 9
由表3可以看出F值为11.748,显著性概率为0.009,表明回归极显著。
表4 回归模型系数表
Model Unstandardized Coefficients
Standardized Coefficients
t Sig
B Std.Error Beta
Constant 10.911 2.078 5.250 0.001
温度 0.889 0.259 0.771 3.428 0.009
从上面的分析结果可知,三月份的平均温度与微生物生长天数关系极为密切,
精品资料
______________________________________________________________________________________________________________
相关系数为0.771,同时方差分析结果表明,其显著性水平为0.009,其回归方程及为y=10.9107-0.8885x。其中x代表三月上旬平均温度,y代表微生物生长天数,预测值的回归误差可用剩余均方估计ε= =1.670。
利用SPSS软件进行预测,2011年三月上旬平均温度为4.3℃,预测值为7.1天,95%的置信区间是3.5-10.6天。
3 结论
回归分析是统计数据分析最强有力的工具之一,而一元线性回归分析则是最简单的分析方法。本文尝试用该方法对微生物生长天数与温度之间的关系进行了统计分析,得到了微生物生长天数与温度的回归方程,取得了较好的拟合结果,同时用该方程进行了预测。由于微生物生长天数除了受气温的影响,还可能受到pH值、酸碱度、营养物质等因素的影响,故对影响微生物生长天数的因素做全面的分析,使用更为复杂的统计分析工具是下一步需要研究的工作。
4 参考文献
[1] 李博纳,赵新泉.概率论与数理统计[M],北京:高等教育出版社,2009.
[2] 章文波,陈红艳.实用数据统计分析及SPSS应用[M],人民邮电出版社,2006,2.
精品资料