二、
多元线性回归模型
欧阳光明(2024.03.07)
在多要素的地理环境系统中,多个(多于两个)要素之间也存在着相互影响、相互关联的情况。因此,多元地理回归模型更带有普遍性的意义。
(一)多元线性回归模型的建立
假设某一因变量y受k个自变量x1,x2,...,xk的影响,其n组观测值为(ya,x1a,x2a,...,xka),a?1,2,...,n。那么,多元线性回归模型的结构形式为:
ya??0??1x1a??2x2a?...??kxka??a(3.2.11)
式中:
?0,?1,...,?k为待定参数; ?a为随机变量。
如果b0,b1,...,bk分别为?0,?1,?2...,?k的拟合值,则回归方程为
?=b0?b1x1?b2x2?...?bkxk(3.2.12)
式中:
b0为常数;
b1,b2,...,bk称为偏回归系数。
偏回归系数bi(i?1,2,...,k)的意义是,当其他自变量xj(j?i)都固定时,自变量xi每变化一个单位而使因变量y平均改变的数值。
根据最小二乘法原理,?i(i?0,1,2,...,k)的估计值bi(i?0,1,2,...,k)应该使
n???Q???ya?ya????ya??b0?b1x1a?b2x2a?...?bkxka???min(3.2.13)
n22a?1??a?1有求极值的必要条件得
???Qn???2????y?y???baa??00a?1????Qn???(3.2.14)???2??b??ya?ya?xja?0(j?1,2,...,k)ja?1??将方程组(3.2.14)式展开整理后得:
?nnnn?nb0?(?x1a)b1?(?x2a)b2?...?(?xka)bk??ya?a?1a?1a?1a?nnnn?1n?(??x1a)b0?(?x21a)b1?(?1?x1ax2a)b2?...?(a?1?x1axka)bk?a?1?x1ayaa?1aa?1?nnnnn?(x)b?(xx)b?(x2)b?...?(??2a0a?1?1a2a1?x2axka)bk??x2ayaa?1?2a2a?1a?1a?1??nnn...nn??(?x)b?(x1axka)b1?(x2axka)b2?...?(x2ka0a?1???ka)bk??xkayaa?1a?1a?1a?1方程组(3.2.15)式,被称为正规方程组。 如果引入一下向量和矩阵:
则正规方程组(3.2.15)式可以进一步写成矩阵形式
Ab?B(3.2.15’)
求解(3.2.15’)式可得:
b?A?1B?(XTX)?1XTY(3.2.16)
如果引入记号:
则正规方程组也可以写成:
3.2.15) (?L11b1?L12b2?...?L1kbk?L1y?Lb?Lb?...?Lb?L2112222kk2y??............??Lb?Lb?...?Lb?Lk22kkkky?k11??b0?y?b1x1?b2x2?...?bkxk(二)多元线性回归模型的显著性检验
(3.2.15’’)
与一元线性回归模型一样,当多元线性回归模型建立以后,也需要进行显著性检验。与前面的一元线性回归分析一样,因变量y的观测值y1,y2,...,yn之间的波动或差异,是由两个因素引起的,一是由于自变量x1,x2,...,xk的取之不同,另一是受其他随机因素的影响而引起的。为了从y的离差平方和中把它们区分开来,就需要对回归模型进行方差分析,也就是将y的离差平方和ST或(Lyy)分解成两个部分,即回归平方和U与剩余平方和Q:
在多元线性回归分析中,回归平方和表示的是所有k个自变量对y的变差的总影响,它可以按公式 计算,而剩余平方和为
以上几个公式与一元线性回归分析中的有关公式完全相似。它们所代表的意义也相似,即回归平方和越大,则剩余平方和Q就越小,回归模型的效果就越好。不过,在多元线性回归分析中,各平方和的自由度略有不同,回归平方和U的自由度等于自变量的个数k,而剩余平方和的自由度等于n?k?1,所以F统计量为: 当统计量F计算出来之后,就可以查F分布表对模型进行显著性检验。