第四章 判别分析
4.1 简述欧几里得距离与马氏距离的区别和联系。
答: 设p维欧几里得空间中的两点X=和
Y=。则欧几里得距离为
。欧几里得距离的局限有①在多元数据分析中,其
度量不合理。②会受到实际问题中量纲的影响。
设
X,Y
是
来
自
均
值
向
量
为
,
协
方
差
为
的总体G中的p维样本。则马氏距离为
D(X,Y)=
。当
即单位阵时,
D(X,Y)==即欧几里得距离。
因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离
的推广。
4.2 试述判别分析的实质。
可复制、编制,期待你的好评与关注!
答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,…,Rk是p维空
间R p的k个子集,如果它们互不相交,且它们的和集为,则称为的一
个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p维空间构造一个“划
分”,这个“划分”就构成了一个判别规则。
4.3 简述距离判别法的基本思想和方法。 答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。 ①两个总体的距离判别问题
设有协方差矩阵∑相等的两个总体G1和G2,其均值分别是1和 2,对于一个新的样品X,
22要判断它来自哪个总体。计算新样品X到两个总体的马氏距离D(X,G1)和D(X,G2),则
X
,D(X,G1)
2D2(X,G2)
X 具体分析,
,D(X,G1)> D(X,G2,
22D2(X,G1)?D2(X,G2)
?(X?μ1)?Σ?1(X?μ1)?(X?μ2)?Σ?1(X?μ2)?1?Σ?1μ1?(X?Σ?1X?2X?Σ?1μ2?μ??X?Σ?1X?2X?Σ?1μ1?μ12Σμ2)?1?Σ?1μ1?μ??2X?Σ?1(μ2?μ1)?μ12Σμ2?2X?Σ?1(μ2?μ1)?(μ1?μ2)?Σ?1(μ1?μ2)?μ1?μ2??1???2?X? ?Σ(μ1?μ2)2????2(X?μ)?α??2α?(X?μ)记W(X)?α?(X?μ) 则判别规则为
可复制、编制,期待你的好评与关注!
X
,W(X)
X
,W(X)<0
②多个总体的判别问题。
设有k个总体G1,G2,?,Gk,其均值和协方差矩阵分别是μ1,μ2,?,μk和Σ1,Σ2,?,Σk,且Σ1?Σ2???Σk?Σ。计算样本到每个总体的马氏距离,到哪个总体的距离最小就属于哪个总体。
2?1具体分析,D(X,G?)?(X?μ?)?Σ(X?μ?)
?Σ?1X?μ??Σ?1μ??X?Σ?1X?2μ??X?C?)?X?Σ?1X?2(I?12
?1?1取I??Σμ?,C???μ??Σμ?,??1,2,?,k。
可以取线性判别函数为
?X?C?, ??1,2,?,k W?(X)?I??X?C?) 相应的判别规则为X?Gi 若 Wi(X)?max(I?1???k
4.4 简述贝叶斯判别法的基本思想和方法。
基本思想:设k个总体G1,G2,?,Gk,其各自的分布密度函数f1(x),f2(x),?,fk(x),假设k个总体各自出现的概率分别为q1,q2,?,qk,qi?0,
?qi?1ki?1。设将本来属于Gi总体的样品
错判到总体Gj时造成的损失为C(j|i),i,j?1,2,?,k。
设k个总体G1,G2,?,Gk相应的p维样本空间为 R?(R1,R2,?,Rk)。 在规则R下,将属于Gi的样品错判为Gj的概率为
P(j|i,R)??fi(x)dx i,j?1,2,?,kRji?j可复制、编制,期待你的好评与关注!