???cov,y?其中: ?yi?1???x?x???
i???y?cov? ?covyi,?yi,?1?1n???cov,?yin?yi??
i?1??12??n????xi-x??
???n?,xi-xcov??yi?i?1???x-x?iLxx?yi?? ? ?
?x?x??2i2L
xx??1 ????n??x?x??2iLxx?????2
注:各个因变量
var(X
y,y......y12n是独立的随机变量
?Y)?var(X)?var(Y)?2cov(X,Y)
?22.10 用第9题证明???ei22n-2是?的无偏估计量
n??2?1??E 证明:E????n-2?i?1???y?y??ii2
1n?2?E?ei? ??n-2i?1??1nvar?ei? ??n-2i?1?n1?1-1-??
n-2i?1?n???x-x?Lixx2??2?? ?? ?1?n?2??2 n-22 ?? 注:var(X)?E(X)?2?E(X)?
22.11验证证明:
F?r2?FF?n?2
SSRSSE(n?2)SSE(n?2)??SSR?SSRF ???*(n?2)所以有
?SSE?1F?rF?n?2?(n?2)??SSR1??F??
以上表达式说明r 2与F 等价,但我们要分别引入这两个统计量,而不是只引入其中一个。理由如下:
①r 2与F,n都有关,且当n较小时,r较大,尤其当n趋向于2时,|r|趋向于1,说明x与y的相关程度很高;但当n趋向于2或等于2时,可能回归方程并不能通过F的显著性检验,即可能x与y都不存在显著的线性关系。所以,仅凭r较大并不能断定x与y之间有密切的相关关系,只有当样本量n较大时才可以用样本相关系数r判定两变量间的相关程度的强弱。
② F检验检验是否存在显著的线性关系,相关系数的 显著性检验是判断回归直线与回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏。
2?SSRSSR1??SSTSSR?SSE1?SSE?????2.12 如果把自变量观测值都乘以2,回归参数的最小二乘法估计?0和?1会发生??什么变化?如果把自变量观测值都加上2,回归参数的最小二乘估计?0和?1会发生什么变化? 解:
解法(一):我们知道当
yi??0??1xi??i,
E(yi)??0??1x时,用最小二乘法估
????0计的和1分别为
⑴当
xi??2xi时
有错误!未找到引用源。
将②③带入①得到
x???2?xi⑵当i时源。
有错误!未找到引用源。 错误!未找到引用源。 将②③带入①得到·
错误!未找到引用
解法(二): 当
yi??0??1xi??in,
E(yi)??0??1x2n时,有
Q(?0,?1)=?(yi?E(yi))??(yi??0??1xi)2i?1i?1
当
xi??2xi时
yi???0?2?1xi??i?yi??1xiE(yi?)??0?2?1xi
Q(?0,?1)?=?(yi??E(yi?))2??(yi??1xi??0?2?1xi)2??(yi??0??1xi)2i?1i?1i?1nnn
当
xi???xi?2n ,
yi????0??1xi?2?1??i?yi?2?12n ,
E(yi??)??0??1xi?2?12nQ(?0,?1)??=?(yi???E(yi??))??(yi?2?1??0??1xi?2?1)??(yi??0??1xi)2i?1i?1i?1由
最小二乘法可知,离差平方和
Q(?0,?1)=Q(?0,?1)??Q(?0,?1)??时,其估计值应
当有错误!未找到引用源。 。
????0即回归参数的最小二乘估计和1在自变量观测值变化时不会变。
2.13 如果回归方程错误!未找到引用源。相应的相关系数r很大,则用它预测时,
预测误差一定较小。这一结论能成立吗?对你的回答说明理由。
解:这一结论不成立。因为相关系数r表示x与错误!未找到引用源。线性关系的密切程度,而它接近1的程度与数据组数有关。n越小,r越接近1。n=2时,|r|=1。因此仅凭相关系数说明x与有密切关系是不正确的。只有在样本量较大时,用相关系数r判定两变量之间的相关程度才可以信服,这样预测的误差才会较小。
2.14 解:(1)散点图为:
(2)x与y大致在一条直线上,所以x与y大致呈线性关系。 (3)得到计算表: X Y (Yi?Y)2?y(Xi?X)2 (Xi?X)(Yi?Y)Y? i 20 10 6 13 ??Y)2(Yi??Y)2(Yii1 2 10 10 4 1 100 100 (-14)2 (-4)2 (-7)2 (3)2 3 4 5 20 20 40 0 1 4 0 0 400 Lyy=600 0 0 40 和Lxy=70 20 27 34 0 72 142 0 72 (-6)2 和100 和15 Lxx=10 均3 均 20 和SSR=490 SSE=110 100 均20
????X??1?7X??? 所以回归方程为: Y01?1n1110??(yi?yi)SSE??n-2i=13 (4)=n?2??22 所以,
??1330?6.13
?1(x)?2?1(x)22?(?)?0:N(?0,(?)?)???t2nLxx?;?nLxx(5)因为 ,0的置信区间为0
?2Lxx,所以,?1的置信区间为 同理,因为Lxy70???Y???X?20?3?7??1.?1 ???t7,?0(3)?3.1821t?/L(n?2)?查表知,2100.025xx所以,
?1:N(?1,??2)???1?t??2?Lxx。
??0的置信区间为(-21.21,19.21),
??1的置信区间为(0.91,13.09)。
SSRSSR490(6)决定系数 R2????0.817SSTLyy600
(7)计算得出,方差分析表如下: 方差来源 SSR SSE SST 平方和 490 110 600 自由度 1 3 4 均方 490 36.667 F值 13.364