要求:
(1)完成上面的方差分析表。
(2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少?
(4)写出估计的回归方程并解释回归系数的实际意义。
(5)检验线性关系的显著性(a=0.05)。 解:(2)R2=0.9756,汽车销售量的变差中有97.56%是由于广告费用的变动引起的。 (3)r=0.9877。
(4)回归系数的意义:广告费用每增加一个单位,汽车销量就增加1.42个单位。 (5)回归系数的检验:p=2.17E—09<α,回归系数不等于0,显著。 回归直线的检验:p=2.17E—09<α,回归直线显著。
11.11 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。要检验x与y之间的线性关系是否显著,即检验假设:H0:?1?0。
(1)线性关系检验的统计量F值是多少? (2)给定显著性水平a=0.05,Fa是多少? (3)是拒绝原假设还是不拒绝原假设?
(4)假定x与y之间是负相关,计算相关系数r。 (5)检验x与y之间的线性关系是否显著?
解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18;
SSR60k 因此:F==1=27 SSE40n?k?118(2)F??1,18?=F0.05?1,18?=4.41 (3)拒绝原假设,线性关系显著。 (4)r=SSR=0.6=0.7746,由于是负相关,因此r=-0.7746
SSR?SSE(5)从F检验看线性关系显著。
11.15 随机抽取7家超市,得到其广告费支出和销售额数据如下: 超市 A B C D E F G 广告费支出(万元) l 2 4 6 10 14 20 销售额(万元) 19 32 44 40 52 53 54
要求:
(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。 (2)检验广告费支出与销售额之间的线性关系是否显著(a=0.05)。 (3)绘制关于x的残差图,你觉得关于误差项?的假定被满足了吗? (4)你是选用这个模型,还是另寻找一个更好的模型? 解:(1)
系数(a)
非标准化系数
模型 1
(常量)
广告费支出(万元)
a. 因变量: 销售额(万元)
标准化系数
Beta
t 6.116
0.831
3.339
显著性
0.002 0.021
B 29.399 1.547
标准误
4.807 0.463
(2)回归直线的F检验:
ANOVA(b)
模型 1
回归 残差 合计
a. 预测变量:(常量), 广告费支出(万元)。 b. 因变量: 销售额(万元)
平方和 691.723 310.277 1,002.000
df
1 5 6
均方 691.723 62.055
F 11.147
显著性 .021(a)
显著。
回归系数的t检验:
系数(a)
非标准化系数
模型 1
(常量)
广告费支出(万元)
a. 因变量: 销售额(万元)
标准化系数
Beta
t 6.116
0.831
3.339
显著性
0.002 0.021
B 29.399 1.547
标准误
4.807 0.463
显著。
(3)未标准化残差图:
10.000005.00000Unstandardized Residual0.00000-5.00000-10.00000-15.0000005101520广告费支出(万元)__
标准化残差图:
1.00000Standardized Residual0.00000-1.00000-2.0000005101520广告费支出(万元)
学生氏标准化残差图:
2.000001.00000Studentized Residual0.00000-1.00000-2.0000005101520广告费支出(万元)看到残差不全相等。 (4)应考虑其他模型。可考虑对数曲线模型:
y=b0+b1ln(x)=22.471+11.576ln(x)。
12.2 根据下面Excel输出的回归结果,说明模型中涉及多少个自变量、少个观察值?写出回归方程,并根据F,se,R2及调整的Ra2的值对模型进行讨论。 SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 方差分析 回归 残差 总计
Intercept X Variable 1 X Variable 2 X Variable 3
df 3 11 14
SS
321946.8018 131723.1982 453670 Coefficients 657.0534 5.710311 -0.416917 -3.471481
MS 107315.6006 11974.84
标准误差 167.459539 1.791836 0.322193 1.442935
F 8.961759
t Stat 3.923655 3.186849 -1.293998 -2.405847
Significance F 0.002724 P-value 0.002378 0.008655 0.222174 0.034870
0.842407 0.709650 0.630463 109.429596 15 解:自变量3个,观察值15个。
?=657.0534+5.710311X1-0.416917X2-3.471481X3 回归方程:y拟合优度:判定系数R2=0.70965,调整的Ra2=0.630463,说明三个自变量对因变量的影响的比例占到63%。
估计的标准误差Syx=109.429596,说明随即变动程度为109.429596
回归方程的检验:F检验的P=0.002724,在显著性为5%的情况下,整个回归方程线性关系
显著。
回归系数的检验:?1的t检验的P=0.008655,在显著性为5%的情况下,y与X1线性关系显著。
?2的t检验的P=0.222174,在显著性为5%的情况下,y与X2线性关系
不显著。
?3的t检验的P=0.034870,在显著性为5%的情况下,y与X3线性关系显
著。
因此,可以考虑采用逐步回归去除X2,从新构建线性回归模型。
???18.4?2.01x1?4.74x2,并且已知n=10,12.3 根据两个自变量得到的多元回归方程为y