§2 方差、协方差与相关系数
方差
例1
比较甲乙两人的射击技术,已知两人每次击中环数分布为:
89??7??.0.601.? ?:?01问哪一个技术较好
78910??6??.0.20.40.201.?. ?:?01首先看两人平均击中环数,此时E??E??8,从均值来看无法分辩孰优孰劣. 但从直观上看,甲基本上稳定在8环左右,而乙却一会儿击中10环,一会儿击中6环,较不稳定.因此从直观上可以讲甲的射击技术较好.
上例说明:对一随机变量,除考虑它的平均取值外,还要考虑它取值的离散程度. 称?-E?为随机变量?对于均值E?的离差(deviation),它是一随机变量. 为了给出一个描述离散程度的数值,考虑用
E???E??,但由于E???E??=E??E?=0对一切随机变量均
2E??E??是不恰当的. 我们改用E???E??描述取
成立,即?的离差正负相消,因此用?值?的离散程度,这就是方差.
E??E??存在,
定义1 若?为有限值,就称它是随机变量?的方差(variance),记作Var?,
2E??E??
Var?=?2 (1)
但Var?的量纲与?不同,为了统一量纲,有时用Var?,称为?的标准差(standard deviation).
??E??方差是随机变量函数?2的数学期望,由§1的(5)式,即可写出方差的计算公式
??(xi?E?)2P(??xi),离散型,?i?????2??(x?E?)2p?(x)dx,连续型.(x?E?)dF(x)?Var?=???=??? (2)
进一步,注意到
22??E?2?E?2E??2?E??E???E???E???? ?==?2即有
2E???E??. ?Var=
2 (3)
许多情况,用(3)式计算方差较方便些. 例1(续) 计算例1中的方差Var?与Var?. 解 利用(3)式
E?=
2?xi2iP(??xi)2=7×+8×+9×=,
2222E???E??=82=. ?Var=
2E???E??= = > Var?, 所以?取值较?分散. 这说明甲的射击技术较好. ?同理, Var=
2例2 试计算泊松分布P(λ)的方差.
解
E???k2k?0??2?kk!e????kk?1???e??(k?1)! e??k?1(k?1)!
??k
??(k?1)k?1e(k?1)!?k???k??
2?jj?0??jj!e?????j?0??jj!e??
????
22所以Var?????????.
2例3 设?服从[ a, b ]上的均匀分布U [a, b],求Var?.
解
E?2??x2ab11dx??a2?ab?b2?b?a3,
21?1???a2?ab?b2????a?b???1?b?a?2?2?12Var?3. N?a,?例4 设?服从正态分布
2?,求Var?.
解 此时用公式(2),由于E??a,
2?E(??a)?Var
??(x?a)2????221e?(x?a)/2?dx?2?
?2?2?
????z2e?z/2dz
2
?2?2?
??ze?z2/2?????e?z2/2dz??????????
?2?g2???22?.
2可见正态分布中参数?就是它的方差, ?就是标准差.
方差也有若干简单而重要的性质. 先介绍一个不等式.
切贝雪夫(Chebyshev)不等式 若随机变量的方差存在,则对任意给定的正数ε,恒有
P???E?????Var??2证 设?的分布函数为
. (4)
F?x?,则
dF(x)??|x?E?|??P???E?????
?=
(x?E?)2|x?E?|???2dF(x)
1?2?????(x?E?)2dF(x)=Var?/?.
2这就得(4)式.
切贝雪夫不等式无论从证明方法上还是从结论上都有一定意义. 事实上,该式断言?落在
???,E????与?E???,???内的概率小于等于Var??E???,E????内的概率大于
行估计. 例如,取 ε=3Var?,则
/?,或者说,?落在区间
221-Var?/?,从而只用数学期望和方差就可对上述概率进
P??E??Var??1?Var????3Var??2≈.
N?a,?2??当然这个估计还是比较粗糙的(当~时,在第二章曾经指出,
P(|ξ-E?|?3Var?)=P(|ξ-a|?3σ)≈ ).
性质1 Var?=0的充要条件是P(ξ=c) =1,其中c是常数.
证 显然条件充分. 反之,如果Var?= 0,记E?= c, 由切贝雪夫不等式, P(|ξ- E?|?ε)=0 对一切正数ε成立. 从而
P???c??1?P???c?0?
n??
.
?1?limP???c?1n??1性质2 设c,b都是常数,则
2Var(c?+b)=cVar?.
2 (5)
证 Var(c?+b)=E(c?+b-E(c?+b))=E(c?+b-cE?-b)
2E(??E?)22c ==cVar?.
2Var??E???c?.
性质3 若c?E?, 则
222证 因 Var?=E?-(E?), 而E(ξ-c)=E?-2cE?+c,
222Var??E???c????E??c??0.这说明随机变量ξ对数学期望E?的离散
两边相减得
度最小.
22性质4
Var(??i)i?1n=
?Var?i?1ni+21?i?j?n?E(?i?E?i)(?j?E?j) (6)
特别若?1,L,?n两两独立,则
Var(??i)i?1n=
n?Var?i?1ni. (7)
证 Var(
??)??ii?1nni=E(
i?1-E(
??))ii?1n2=E
(?(?i?E?i))2i?1
= E
(?(?i?E?i)2?2i?1n1?i?j?n?(?ii?E?i)(?j?E?j))
=
?Var?i?1ni+21?i?j?n?E(??E?i)(?j?E?j),
E???E?iE?j得证(6)式成立. 当?1,L,?n两两独立时,对任何1?i,j?n有ij,
故 E
(?i?E?i)(?j?E?j)=E(
?i?j??iE?j??jE?i?E?iE?j)
=E
?i?j?E?iE?j=0,
这就得证(7)式成立.
利用这些性质,可简化某些随机变量方差的计算. 例5 设ξ服从二项分布B(n, p), 求Var?.
解 如§1例12构造?i,i?1,L,n, 它们相互独立同分布,此时
22222Var?i?E?i?(E?i)?1?p?0?q?p=pq.
由于相互独立必是两两独立的,由性质4
Var??Var(??i)??Var?ii?1i?1nn?npq.
2例6 设随机变量?1,L,?n相互独立同分布, E?i?a, Var?i=?,
1n?i??i?1,L,nn(). 记=i?1, 求E?,Var?.
解 由§1性质2和本节性质2和4有
1n??E?iE?ni?1?a,
2?12Var?i?n???i?1n. n2n1?2Var?n这说明在独立同分布时,?作为各?i的算术平均,它的数学期望与各?i的数学期望相同,但方差只有?i的1/ n倍. 这一事实在数理统计中有重要意义. 例7 设随机变量ξ的期望与方差都存在,Var??0. 令
?*???E?Var?,
**E??称它为随机变量ξ的标准化. 求与Var.
解 由均值与方差的性质可知