请下载支持!
葿罿羂螄螅袁袀协方差分析理论与案例
蒀螀芅袈肇羃蒅假设我们有N个个体的K个属性在T个不同时期的样本观测值,用
yit,xit,…,N,t=1,…,T,k=1,…,K表示。一般假定y的观测值是某随机实
验的结果,该实验结果在属性向量x和参数向量?下的条件概率分布为
f(yx,?)。使用面板数据的最终目标之一就是利用获取的信息对参数?进行统计推断,譬如常假设假定的y是关于x的线性函数的简单模型。协方差分析检验是识别样本波动源时广泛采用的方法。
袃蚆蚇薈袂羆芈方差分析:常指一类特殊的线性假设,这类假设假定随机变量y的期望值仅与所考察个体所属的类(该类由一个或多个因素决定)有关,但不包括与回归有关的检验。而协方差分析模型具有混合特征,既像回归模型一样包含真正的外生变量,同时又像通常的方差一样允许每个个体的真实关系依赖个体所属的类。
羃薆聿蚁蒆膆羁常用来分析定量因素和定性因素影响的线性模型为:
虿薀螃蚃羅膇螂从两个方面对回归系数估计量进行检验:首先,回归斜率系数的同质性;其次,回归截距系数的同质性。检验过程主要有三步:
(1) 羁蚂膄肈蚈薁莃检验各个个体在不同时期的斜率和截距是否都相等;
(2) 薁蚅羇聿螃袄薇检验(各个体或各时期的)回归斜率(向量)是否都相等; (3) 膅袅薀薂莅莆蒁检验各回归截距是否都相等。 羈肀蒁袆葿蚈蚄显然,如果接受完全同同质性假设(1),则检验步骤中止。但如果拒绝了完全同质性性假设,则(2)将确定回归斜率是否相同。如果没有拒绝斜率系数的同质性假设,则(3)确定回归截距是否相等。(1)是从(2)、(3)分离出来的。
薁薄肂莇腿蒂蚆基本思想:在作两组或多组均数y1,y2,…,yk的假设检验前,用
线性回归分析方法找出协变量X与各组Y之间的数量关系,求得在假定X相等时修定均数y1?,y2?,…,yk?然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想。
莂薃芆蚀莁袃螇协方差分析的应用条件:⑴要求各组资料都来自正态总体,且各组的方差相等;(t检验或方差分析的条件)⑵各组的总体回归系数?i相等,且都不等于0(回归方程检验)。因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。
肄肅膀蒄莄蚆螈⑴各比较组协变量X与分析指标Y存在线性关系(按直线回归分析方法进行判断)。
膈蚁莃螄螈艿芁⑵各比较组的总体回归系数?i相等,即各直线平行(绘出回归直线,
看是否平行)。
袈膁芅蚇蝿膀薅协方差分析适用的资料:完全随机设计、随机区组设计、拉丁方设
请下载支持!
计、析因设计等资料;协变量X可以仅有一个,称一元协方差分析;协变量也可以有多个,称多元协方差分析。 肀螆蒆芀芃肅肆协方差计算公式:
羃蕿螁肁薆袅莈相关系数:r??(x?x)(y?y)?(x?x)?(y?y)22 将公式右端的分子分母同除以自由度(n-1),得:
蒈肃芄袇莀羂蒃其中:
蒇羈羀螃肈衿膃?(x?x)羂螄螅袁袀羄芆2n?1是x的均方MSx,它是x的方差?x2的无偏估计量;
2?(y?y)芅袈肇羃蒅葿罿n?12是y的均方MSy,它是y的方差?y的无偏估计量;
?(x?x)(y?y)称为x与y的平均的离均差的乘积和,简称均积,记为
蚇薈袂羆芈蒀螀n?1MPxy,即
聿蚁蒆膆羁袃蚆 与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或
?xy。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即EMPxy= COV(x,y)。于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示
为:
螃蚃羅膇螂羃薆相应的总体相关系数ρ可用x与y的总体标准差?x、?y,总体协方差
COV(x,y)或?xy表示如下:
均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个
变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得相应均积的方法亦称为协方差分析。
羇聿螃袄薇羁蚂1.协方差分析是将线性回归与方差分析相结合的一种分析方法; 薀薂莅莆蒁薁蚅2.把对反应变量Y有影响的因素X看作协变量,建立Y对X的线性回归,利用回归关系把X值;
蒁袆葿蚈蚄膅袅3.化为相等,再进行各组Y的修正均数间比较。修正均数是假设各协变量取值固定在其总均数时的反应变量Y的均数。
膄肈蚈薁莃虿薀肂莇腿蒂蚆羈肀其实质是从Y的总离均差平方和?(Y?Y)2中,扣除协变量X对Y的
?2?回归平方和?(Y?Y),对离回归平方和?(Y?Y)2作进一步分解后再进行方差分析。 方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变
量,方差分析数据结构:
芆蚀莁袃螇薁薄
请下载支持!
羀螃肈衿膃羃蕿协方差分析将方差分析与回归分析结合了起来,协方差分析数据结构: 莃螄螈艿芁肄肅第i蒆芀芃肅肆袈膁第芅蚇蝿膀薅膈蚁随螁肁薆袅莈肀螆一般膀蒄莄蚆螈莂薃?uy?ti??e(Xij?ux)??ijYij协方差案例:
肇羃蒅葿罿羂螄蒆膆羁袃蚆蚇薈设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值螅袁袀羄芆蒈肃协变量效回归系数 x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表应 10—1所示。
袂羆芈蒀螀芅袈羅膇螂羃薆聿蚁蚈薁莃虿薀螃蚃螃袄薇羁蚂膄肈组第j个观测值 均值 芄袇莀羂蒃蒇羈i组的组效机误差
表1 kn对观测值x、y的单向分组资料的一般形式 莅莆蒁薁蚅羇聿处理1 处葿蚈蚄膅袅薀薂腿蒂蚆羈肀蒁袆处莁袃螇薁薄肂莇莄蚆螈莂薃芆蚀处处 理 螈艿芁肄肅膀蒄理2 蝿膀薅膈蚁莃螄理i 肈衿膃羃蕿螁肁理k 袀羄芆蒈肃芄袇… y 羈羀螃肈衿膃羃蚃羅膇螂羃薆聿… x y 肁薆袅莈肀螆蒆k1膆羁袃蚆蚇薈袂k1x 芃肅肆袈膁芅蚇x 薆袅莈肀 螆蒆芀x 莀羂蒃蒇 羈羀螃观测指标 莃虿薀螃蚃羅膇11薇羁蚂膄肈蚈薁12蒁薁蚅羇蒅葿罿羂螄螅袁聿螃袄y 螈莂薃芆蚀莁袃11蒃蒇羈羀螃肈衿y 薀螃蚃羅膇螂羃… … 薃芆蚀莁袃螇薁蚀莁袃螇薁薄肂x x … y y … 芁肄肅膀蒄莄蚆12x21 芆蒈肃芄袇莀羂y21 蚂膄肈蚈薁莃虿… xi1 肃芄袇莀羂蒃蒇yi1 肈蚈薁莃虿薀螃… x y 肅膀蒄莄蚆螈莂蒄莄蚆螈莂薃芆螃肈衿膃羃蕿螁k2膇螂羃薆聿蚁蒆k2薅膈蚁莃螄螈艿x22 罿羂螄螅袁袀羄y22 蚅羇聿螃袄薇羁… xi2 螄螅袁袀羄芆蒈yi2 聿螃袄薇羁蚂膄… x y 观测值 芈蒀螀芅袈肇羃蚄膅袅薀薂莅莆1j蚆羈肀蒁袆葿蚈肆袈膁芅蚇蝿膀1j蚁莃螄螈艿芁肄螄螈艿芁肄肅膀袇莀羂蒃蒇羈羀薁莃虿薀螃蚃羅x … y … xij、yij 羁袃蚆蚇薈袂羆莈肀螆蒆芀芃肅… … … … … … … … 螀芅袈肇羃蒅葿袅薀薂莅莆蒁薁膁芅蚇蝿膀薅膈袈肇羃蒅葿罿羂薂莅莆蒁薁蚅羇蚇蝿膀薅膈蚁莃袁袀羄芆蒈肃芄kj袄薇羁蚂膄肈蚈kj(i=1,2,…k 螂羃薆聿蚁蒆膆螇薁薄肂莇腿蒂膃羃蕿螁肁薆袅1ny x2j 蚆蚇薈袂羆芈蒀y2j 肀蒁袆葿蚈蚄膅… xij 薈袂羆芈蒀螀芅yij 袆葿蚈蚄膅袅薀… x y j=1,2,…n) x1n 螆蒆芀芃肅肆袈芀芃肅肆袈膁芅羃蒅葿罿羂螄螅莆蒁薁蚅羇聿螃… … … … … … … … 薆聿蚁蒆膆羁袃薄肂莇腿蒂蚆羈蕿螁肁薆袅莈肀蚁蒆膆羁袃蚆蚇莇腿蒂蚆羈肀蒁羆芈蒀螀芅袈肇kn羂蒃蒇羈羀螃肈蚈蚄膅袅薀薂莅kn 葿罿羂螄螅袁袀kx2n 蒂蚆羈肀蒁袆葿y2n 膀薅膈蚁莃螄螈… xin 袅莈肀螆蒆芀芃yin 衿膃羃蕿螁肁薆x y袃螇薁薄肂莇腿蚆螈莂薃芆蚀莁1艿芁肄肅膀蒄莄肅肆袈膁芅蚇蝿羄芆蒈肃芄袇莀k总和 蒀螀芅袈肇羃蒅y. x1. 袃蚆蚇薈袂羆芈羃薆聿蚁蒆膆羁x2. 虿薀螃蚃羅膇螂y2. 羁蚂膄肈蚈薁莃… xi. 膅袅薀薂莅莆蒁yi. 羈肀蒁袆葿蚈蚄… x. y. 薁蚅羇聿螃袄薇薁薄肂莇腿蒂蚆莂薃芆蚀莁袃螇肄肅膀蒄莄蚆螈平均数 … … 膈蚁莃螄螈艿芁表1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分