第十章典型相关分析
安庆师范学院 胡云峰
习题10.2 下表给出著名统计学家Rao在1952年对25个家庭的成年长子的头长(x1)、
头宽(x2)、与次子头长(y1)、头宽(y2)进行调查所得数据如下: 长子 头长 191 195 181 183 176 208 189 197 188 192 179 183 174 头宽 155 149 148 153 144 157 150 159 152 150 158 147 150 头长 179 201 185 188 171 192 190 189 197 187 186 174 185 次子 头宽 145 152 149 149 142 152 149 152 159 151 148 147 152 头长 190 188 163 195 186 181 175 192 174 176 197 190 长子 头宽 159 151 137 155 153 145 140 154 143 139 167 163 头长 195 187 161 183 173 182 165 185 178 176 200 187 次子 头宽 157 158 130 158 148 146 137 152 147 143 158 150
x=[191 155 179 145;195 149 201 152;181 148 185 149;... 183 153 188 149;176 144 171 142;208 157 192 152;... 189 150 190 149;197 159 189 152;188 152 197 159;... 192 150 187 151;179 158 186 148;183 147 174 147;... 174 150 185 152;190 159 195 157;188 151 187 158;... 163 137 161 130;195 155 183 158;186 153 173 148;... 181 145 182 146;175 140 165 137;192 154 185 152;... 174 143 178 147;176 139 176 143;197 167 200 158;...
190 163 187 150] 第一步计算相关系数矩阵 程序 R=corrcoef(x) 输出结果R =
1.0000 0.7346 0.7108 0.7040 0.7346 1.0000 0.6932 0.7086 0.7108 0.6932 1.0000 0.8393
0.7040 0.7086 0.8393 1.0000 计算A、 B的特征值特征向量 程序
R11=R([1,2],[1,2]); R12=R([1,2],[3,4]);
R21=R([3,4],[1,2]); R22=R([3,4],[3,4]);
A=(R11^(-1))*R12*(R22^(-1))*R21; B=(R22^(-1))*R21*(R11^(-1))*R12; [X1 B1]=eig(A); [X2 B2]=eig(B); s=cov(x);
s1=s([1 2],[1 2]); s2=s([3,4],[3,4]); s1(1,2)=0; s1(2,1)=0; s2(1,2)=0; s2(2,1)=0; B1=B1^(1/2) l=(s1^(-1))*X1 B2=B2^(1/2) m=(s2^(-1))*X2 输出结果 B1 =
0.7885 0 0 0.0537 l =
0.0076 -0.0074 0.0126 0.0131 B2 =
0.0537 0 0 0.7885 m =
-0.0070 -0.0068 0.0157 -0.0162
从而得出典型相关系数和典型变量
??0.0076X?0.0126X?U?12??0.7885??1?1???V1??0.0068X3?0.0162X4
???0.0074X?0.0131X??U12??2?0.0537??2???V2??0.0070X3?0.0157X4第三步 典型相关系数的显著性检验
这里由于数据比较少就不用程序计算了,直接手算
??0.7885 (1)?1n?25,p1?2,p2?2?21???2?0.3772?0?1??12ln?0??0.97501Q0??[n?1??p1?p2?1?]ln?0?20.96252?0.05(4)?9.488?20.9625
?????0.01(4)?13.277?20.9625?为高度显著 所以第一个典型相关系数?1??0.0537 (2)?2?2?0.9971?0?1??2ln?0??0.00291Q0??[n?2??p1?p2?1?]ln?0?0.05942?0.05(1)?3.841?0.0594
???不显著,对第二个典型变量价值不大 所以第二个典型相关系数?2第四步结果分析
根据上步的结果可知,对原始两组变量的研究可转化为对第一对典型变量的研究, 通过它们之间相关性的研究来反映原始两组变量的相关关系。