(7)计算得出,方差分析表如下: 方差来源 SSR SSE SST 平方和 490 110 600 自由度 1 3 4 均方 490 36.667 F值 13.364 查表知,F0.05(1,3)=10.13,F值>F0.05(1,3),故拒绝原假设,说明回归方程显著。
(8)做回归系数β1的显著性检验
t??1?/Lxx?2???1Lxx???? 计算t统计量:
t?/2(n?2)?t0.025(3)?3.182,所以,t>t0.05/2(3),所以接受原假设, 查表知,
说明x和Y有显著的线性关系。
SSRSSR490R2????0.817(9)做相关系数r的显著性检验:因为 SSTLyy6002r?R?0.951 所以,相关系数 因为查表知,n-2等于3时,??1%的值为0.959,??5%的值为0.878 。 所以,??5%<|r|?1%,故x与y有显著的线性关系。 (10)残差表为:
序号 1 2 3 4 5 残差图为:
x 7?1021??3.661333303
y 10 10 20 20 40 y ?残差4 -3 0 -7 6 e 1 2 3 4 5 6 13 20 27 34 (11)当X0=4.2时,
其95%的置信区间近似为近似为y?2?,即为: (17.1,39.7)。 2.15解:
(1)画散点图;
图形→旧对话框→散点图,得到散点图(表1)如下:
?? (2)x与y之间是否大致呈线性关系?
由上面(1)散点图可以看出,x与y之间大致呈线性关系。
用最小二乘估计求出回归方程;
分析→回归→线性,得到“回归系数显著性检验表(表2)”如 下: Coefficientsa Unstandardized Standardized Coefficients Coefficients Model B Std. Error Beta t 1 (Constant) .118 .355 .333 每周签发的新保单数.004 .000 .949 8.509 目x a. Dependent Variable: 每周加班工作时间y 由上表可知: ^^?? 0=0.118 1=0.004
^ 所以可得回归方程为:y=0.118+0.004x
(4)求回归标准误差?;
分析→回归→线性,得到“方析分析表(表3)”如下: ANOVAb Sum of Model Squares df Mean Square F 1 Regression 16.682 1 16.682 72.396 Residual 1.843 8 .230 Total 18.525 9 a. Predictors: (Constant), 每周签发的新保单数目x b. Dependent Variable: 每周加班工作时间y 由上表可得, SSE=1.843 n=10 故回归标准误差为:
^^Sig. .000a ?^21=n?2^?(y?y)i?1n^2iiSSE1.843=n?2=10?2=0.23
?=
?2=0.48
(5)给出
?^0与
?^1的置信度为95%的区间估计;
由表2可以看出,当置信度为95%时,
??^^0的预测区间为:[-0.701,0.937]
1的预测区间为:[0.003,0.005]
(6)计算x与y的决定系数;
分析→回归→线性,得到“模型概要表(表4)”如下: Model Summaryb Model 1 R .949a R Square .900 Std. Error of the Adjusted R Square Estimate .888 .4800 a. Predictors: (Constant), 每周签发的新保单数目x b. Dependent Variable: 每周加班工作时间y 由上表可知,x与y的决定系数为0.9,可以看到很接近于1,这就说明此模型的拟合度很好。
(7)对回归方程作方差分析; 由“方差分析表(表3)”可得,F-值=72.396,
? 我们知道,当原假设H0:1=0成立时,F服从自由度为(1,n-2)的F分布(见P38),临界值F?(1,n-2)=F0.05(1,8)=5.32 因为F-值=72.396>5.32,
所以拒绝原假设,说明回归方程显著,即x与y有 显著的线性关系。
?(8)做回归系数1显著性的检验;
由“回归系数显著性检验表(表2)”可得,
^ ?1的t检验统计量为t=8.509,对应p-值近似为0,p,
说明每周签发的新报单数目x对每周加班工作时间y有显著的影响。 (9)做相关系数的显著性检验;
分析→相关→双变量,得到“相关分析表(表5)”如下: Correlations 每周签发的新保单数目Pearson x Correlation Sig. (2-tailed) N 每周加班工作时间y Pearson Correlation Sig. (2-tailed) N 每周签发的新每周加班工作保单数目x 时间y 1 .949** 10 .949** .000 10 .000 10 1 10 **. Correlation is significant at the 0.01 level (2-tailed). 由上表可知,相关系数为0.949,说明x与y显著线性相关。 (10)对回归方程作残差图并作相应的分析;
从上图可以看出,残差是围绕e=0随即波动的,满足模型的基本假设。 (11)该公司预计下一周签发新保单x0=1000张,需要的加班时间是多少?
y 当x0=1000张时,0=0.118+0.004×1000=4.118小时。 y(12)给出0的置信水平为95%的精确预测区间和近似预测区间。 y(13)给出E(0)置信水平为95%的区间估计。
最后两问一起解答:
在计算回归之前,把自变量新值x0输入样本数据中,因变量的相应值空
y缺,然后在Save对话框中点选Individul和Mean计算因变量单个新值0和因y变量平均值E(0)的置信区间。结果显示在原始数据表中,如下图所示(由于排
版问题,中间部分图省略):