7.1 设随机变量X?(X1,X2)?的协差阵为???和特征向量,并写出主成分。 解:先求X的特征根?,?满足方程:
2??112即2?0,(??)?1?02???21?,试求X的特征根??12?,因此两个特征根分别为?1?3,?2?1.
设?1?3对应的单位特征向量为?a11,a21??,则?a11,a21??满足:
?1??a11????11??a11??0?2???,故可以取????1?1??a??0??,其对应主成分为: a1???21????21???2??F1?22X1?X2; 22设?2?1对应的单位特征向量为?a12,a22??,则?a12,a22??满足:
?1??a12???11??a12??0?2??,故可以取,其对应的主成分为: ?????11??a??0??a???22????22???1?2??F2?22X1?X2. 22?1?20??,试求X的?250设随机变量X?(X1,X2,X3)?的协差阵为???????002??7.2
主成分及主成分对变量X的贡献率。 解:先求X的特征根?,?满足方程:
1???20?25??0?0,即(2??)??2?6??1??0,因此三个特征根分别为
002???1?5.8284,?2?2,?3?0.1716
设?1?5.8284对应的单位特征向量为?a11,a21,a31??,则它满足:
??4.8284?20??a11??0???2?0.82840??a???0?,故可以取 ???21????a??0????31??00?3.8284???1?a11????0.3827?1??????a??2.4142??0.9239?21?2.6131????,其对应主成分为: ?a?????00?31?????F1?0.3827X1?0.9239X2,其贡献率为
5.8284?72.86%;
5.8284?2?0.1716设?2?2对应的单位特征向量为?a12,a22,a32??,则它满足:
??1?20??a12??0??a12??0???230??a???0?,故可以取?a???0?,其对应主成分为:
?22??????22????a??0??a??1????32??000????32???F2?X3,其贡献率为
2?25%;
5.8284?2?0.1716设?3?0.1716对应的单位特征向量为?a13,a23,a33??,则它满足:
?0.8284?20??a13??0???24.82840??a???0?,故可以取 ???23????a??0????33??001.8284????a13??1??0.9239?1??????a?0.4142?0.3827?23?1.0824????,其对应主成分为: ?a??0??0??33?????F3?0.9239X1?0.3827X2,其贡献率为
0.1716?2.14%.
5.8284?2?0.1716 7.3
?14??设随机变量X?(X1,X2)的协差阵为????,试从?和相关4100??阵R出发求出总体主成分,并加以比较。
解:(1) 先从?出发求总体主成分,先求特征根?,?满足方程:
1??4?04100??,即?2?101??84?,0因此两个特征根分别为
?1?100.1614,?2?0.8386.
设?1?100.1614对应的单位特征向量为?a11,a21??,则它满足:
?a11???99.16144??a11??0??1??0.0403?1,故可以取, ??????????4?0.1614??a??0????21????a21?24.8106?24.7904??0.9992?其对应主成分为:F1?0.0403X1?0.9992X2;
设?2?0.8386对应的单位向量特征向量为?a12,a22??,则它满足:
?0.16144??a12??0??a12??24.7904??0.9992?1?,故可以取, ????499.1614??a??0?????????22????a22?24.8106??1???0.0403?其对应的主成分为:F2?0.9992X1?0.0403X2. (2) 先从R出发求总体主成分,容易看出R??先求特征根?,?满足方程:
1??0.40.4?0,即(1??)2?0.16?0,因此两个特征根分别为 1???10.4?. ??0.41??1?1.4,?2?0.6.
设?1?1.4对应的单位特征向量为?a11,a21??,则?a11,a21??满足:
?1??a11????0.40.4??a11??0?2??,故可以取,其对应主成分为: ????0.4?0.4??a??0????a21??1????21???2??F1?22X1?X2; 22设?2?0.6对应的单位特征向量为?a12,a22??,则?a12,a22??满足:
?1??a12???0.40.4??a12??0?2???,故可以取 ????0.40.4??a??0??,其对应的主成分为:a1???22????22????2??F2?22X1?X2 22由于X1,X2的方差差距很大,所以如果从协方差阵出发,就导致
两个主成分贡献率相差非常大,而且主成分中两个变量的系数相差非常大;反之从相关阵出发时,两个主成分贡献率相差不大,主成分中两个变量的系数比较均衡。
7.4 文件中数据是将广东省21个地级市2009年的8个经济指标,利用主成分分析的方法从这8个经济指标中提取适当的主成分,并进行适当的命名和分析,给出其综合得分函数。
城市 广州 深圳 珠海 汕头 佛山 韶关 河源 梅州 惠州 汕尾 东莞 中山 江门 阳江 湛江 茂名 肇庆 清远 潮州 揭阳 云浮 X1 82.53 100 87.16 69.58 92.36 47.29 40.5 46.2 61.27 57 86.39 86.34 50.08 46.72 38.99 37.5 44.89 34.93 62.1 45.36 50.2 X2 2659.85 1709.15 410.51 291.9 1470.56 356.5 198.15 162.98 758.97 289.43 1094.08 545.61 492.07 239.49 393.23 180.01 462.77 841.24 162.98 393.5 240.19 X3 27609.6 29244.5 22858.6 13650.9 24577.9 16288.7 13113.3 21278 33044.6 X4 22820.9 21526.1 17948.4 11659.5 19295.6 11467.6 10365.7 17913.9 24269.9 X5 3615.77 2567.94 404.46 661.96 1408.78 278.36 139.5 267.98 491.1 282.06 959.07 549.76 562.07 305.38 559.94 591.05 275.78 303.56 207.89 341.46 117.91 X6 60.9 53.2 44.8 39.5 35 45 34.9 39.3 37.8 38.2 51.2 39.4 34.2 36 39.9 43.1 43.7 31.9 37.6 33.6 33.7 X7 374.05 177.83 40.16 245.78 5.79 14.13 6.71 171.49 9.48 551.67 177.36 79.49 12.3 13.65 5.32 20.3 14.15 18.7 25.25 6.16 X8 88424.71189 69652.80797 20282.83847 80391.16195 19490.55365 13729.38507 12528.23307 35615.98569 13287.30274 59274.23927 62222.89651 31915.39277 21999.29294 16537.29201 19853.45836 22169.19445 22513.00645 18653.62032 14093.4095 14128.88059 1619.79 92024.45885 12137.99 8054.92 12560.21 8735.73 23088.39 17414.7 19003.76 14262.87 13075.21 9164.85 13665.2 13160.64 15063 10470.1 9764.1 11030.3 14314.79 9851.89 12398.2 10758.29 13169.24 10463.1 13211 11383.48 表1 广东省21个地级市2009年的8个经济情况 其中变量为:X1城镇人口占常住人口比例(%)、X2固定资产投资(亿元)、X3人均可支配收入(元)、X4人均消费支出(元)、X5社会消费品零售总额(亿元)、X6第三产业占GDP百分比、
X7出口总额(亿美元)、X8人均地区生产总值(元)。 解:
1. 读入数据; SAS程序:
Data economy; input X1-X8; cards; 82.52659.827609.6
3 5 100 1709.129244.5
5 87.1410.51
22858.6
6 69.5291.9
13650.9
8 92.31470.524577.9
6 6 47.2356.5
16288.7
9 40.5 198.15 12137.99 46.2 162.98 13113.3 61.2758.97
21278
7 57 289.43 12560.21 86.31094.033044.6
9 8 86.3545.61
23088.34 9 50.0492.07 19003.78 6 46.7239.49 13075.22 1 38.9393.23 13665.2
9 37.5 180.01 13160.64 44.8
462.77
15063
22820.9
21526.1
17948.4
11659.5
19295.6
11467.6
8054.92
10365.7 17913.9
8735.73
24269.9
17414.7
14262.87 9164.85
10470.1
9764.1
11030.3
3615.77 2567.94 404.46
661.96
1408.78 278.36
139.5
267.98 491.1
282.06
959.07
549.76
562.07
305.38 559.94
591.05
275.78
60.374.05
9 53.1619.72 9 44.177.83 8 39.40.16 5 35
245.78 45
5.79
34.14.13
9 39.6.71 3 37.171.49 8 38.9.48 2 51.551.67 2 39.177.36 4 34.79.49 2 36
12.3 39.13.65
9 43.5.32 1 43.
20.3 88424.71189
92024.45885
69652.80797
20282.83847
80391.16195
19490.55365
13729.38507
12528.23307
35615.98569
13287.30274
59274.23927
62222.89651
31915.39277
21999.29294
16537.29201
19853.45836
22169.1944