概率论与数理统计第14讲(夜大)
切比雪夫不等式
定理:设随机变量X具有数学期望EX??,方差DX??,则对于任意正数??0,
2?2DX不等式P?X??????2,或写为P?X?EX????2。
?? 证明:我们只就连续型随机变量的情况来证明。设X的概率密度为f?x?,则有
P?X??????x?f?x?dx???????x?x?????2f?x?dx?1?2??x??????2?2f?x?dx?2
?切比雪夫不等式也可以写成如下形式
?2 P?X??????1?2 (画出图形)
? 这个不等式给出了在随机变量X的分布未知的条件下事件X????概率的下限的估计。例如,如果取??3?,4?得到
???2 P?X???3???1??0.8889
9?2?2P?X???4???1??0.9375 216?当然,如果X服从正态分布,则有PX???3??0.9974(3?法则)。 柯西—施瓦兹不等式
设X,Y是两个随机变量,E?X?,E?Y?存在,则有[E?XY?]?E?X?E?Y?
22222?? 证明:考虑实变量t的函数
g?t??E?X?tY??EX?2tE?XY??tEY?0
2222??对任意t都成立,所以判别式
???2E?XY???4EXEY?0
222即有[E?XY?]?E?X?E?Y?。
222 例1 设X1,?,Xn是n个相互独立同分布的随机变量,EXi??,DXi?8,
i?1,?,n,对于X??i?1n1Xi,求PX???4的概率。 n1
??
解: E(X)?E(n?nXi?1n1i)?1?n??? n D(X)?D(n118 X)??nDX??ii2nnni?1于是X?1Xi所满足的切比雪夫不等式为 ?i?1n PX???????DX?2?8n?2
所以 PX???4?1???DX181 ?1???1?216n2n4 例2 在每次试验中,事件A发生的概率为0.75,利用切比雪夫不等式估计:在1000
次独立实验中,事件A发生次数在650—850之间的概率。
解:由于切比雪夫不等式中涉及到随机变量的期望、方差及任意正数,所以利用该不等式估计事件的一般步骤是:
(1)选择随机变量X,设X表示在1000次独立试验中事件A发生的次数。问题转化为估计X在650—850之间的概率。
(2)求X的期望和方差。由于X~B?1000,0.75?,所以 EX?np?1000?0.75?750
DX?np?1?p??187.5
(3)需要确定?,这里?并没有直接给出。要估计?650?X?850?的概率,首先将其改为
?650?X?850???650?EX?X?EX?850?EX????100?X?750?100???X?750?100?
于是在切比雪夫不等式中取??100。得到 P?650?X?850??PX?750?100?1?
解这类问题常常要通过恒等式变形把已给事件?a?X?b?化成符合切比雪夫不等式所要求的形式X?EX??,从而定出?,然后用切比雪夫不等式估计它的概率。 利用切比雪夫不等式作简单估计的另一类问题是:已知事件X?EX??的概率至少为p,求?。
??DX?2?1?187.5?0.98125
10000???? 2
第三节 协方差及相关系数
对于二维随机变量?X,Y?,我们除了要讨论X与Y的数学期望和方差以外,还需要讨论描述X与Y之间的相互关系的数字特征。在前面讨论方差的性质中,我们已经看到,对于两个随机变量,有
D?X?Y??DX?DY?2E??X?EX??Y?EY??
如果两个随机变量相互独立,则D?X?Y??DX?DY,这意味着如果两个随机变量相互独立,一定有E??X?EX??Y?EY???0。也就是说,如果当E??X?EX??Y?EY???0,X与Y不相互独立,而是存在一定的关系。显然,这个表达式可以反应两个随机变量的某种关系。为此,我们有如下定义
定义:量E??X?EX??Y?EY??称为随机变量X与Y的协方差。记为Cov?X,Y?,即 Cov?X,Y??E??X?EX??Y?EY?? 而 ?XY?称为随机变量X与Y的相关系数。 ?XY是一个无量纲的量。
由定义可以知道,Cov?X,Y??Cov?Y,X?;Cov?X,X??DX,并且有
Cov?X,Y?DXDY
D?X?Y??DX?DY?2Cov?X,Y?
将Cov?X,Y?按定义展开,容易得到
Cov?X,Y??E?XY??EX?EY 我们常常利用这个公式计算协方差。 协方差具有下述性质:
(1)Cov?aX,bY??abCov?X,Y?,其中a,b是常数 (推导) (2)Cov?X1?X2,Y??Cov?X1,Y??Cov?X2,Y? (推导)
下面我们讨论相关系数?XY的性质,并说明其含义。为此,考虑以X的线性函数a?bX来近似线性表示Y。其近似的好坏程度我们以均方误差
e?E?Y??a?bX???EY2?b2EX2?a2?2bE?XY??2abEX?2aEY
2来衡量以a?bX近似表示。e值越小表示近似程度越好。这样我们就取a,b使e最小。为
3
此,将e分别关于a,b求偏导数,并令其为零,得到
?e?2a?2bEX?2EY?0 ?a?e?2bEX2?2E?XY??2aEX?0 ?bCov?X,Y?Cov?X,Y?解得 b0?; a0?EY?b0EX?EY?EX,将其代入得到
DXDXminE?Y??a?bX???E?Y??a0?b0X???1??2XYDY
22a,b??由此有以下定理
定理:(1)?XY?1
(2)?XY?1的充要条件是存在常数a,b使P{Y?a?bX}?1 证明:(1)略
(2)若?XY?1,则有E?Y??a0?b0X???0,从而
2E?Y??a0?b0X???D?Y??a0?b0X????E?Y??a0?b0X????0
22故有D?Y??a0?b0X???0;?E?Y??a0?b0X????0 由方差性质,可知P{Y?a0?b0X}?1
反之,若存在常数a?,b?,使P{Y?a??b?X}?1,于是P{[Y?a??b?X]?0}?1,即E?Y??a??b?X???0,故有
222220?E?Y??a??b?X???minE?Y??a?bX???1??XYDY
a,b??得到 ?XY?1 证毕。 由e?minE?Y??a?bX???1??2XYDY可知,e是?XY的严格单调减函数,这
2a,b??样?XY的关系就清楚了。当?XY较大时,e较小,表明X,Y的线性关系比较紧密。特别当
?XY?1时,可知X,Y之间以概率1存在线性关系。于是?XY是一个可以用来表征X,Y
之间线性关系紧密程度的灵。当?XY较大时,我们说X,Y线性相关程度较好;反之,就说X,Y线性相关程度较差。
当?XY?0时,称X,Y不相关。
假设X,Y的相关系数存在,当X,Y相互独立时,可以知道Cov?X,Y??0,从而?XY?0,
4
即X,Y不相关。反之,若X,Y不相关,X,Y却不一定相互独立。这是因为不相关只是就线性关系来说的,而相互独立是就一般关系(包括线性和非线性关系)而言的。 (以图说明)
但是对于正态分布而言,二者是等价的。回忆二维正态随机变量?X,Y?,其概率密度为
f?x,y??12??1?22??x??1??y??2?2????1??x??1??exp??2??? ??2222?1?2?2???1???21????1???现在求X,Y的相关系数,可以得到?XY??,而我们已经知道X,Y相互独立的充分必要条件是??0。所以对二维正态随机变量来说,X,Y不相关与X,Y相互独立是等价的。
例1 设W??aX?3Y?,EX?EY?0,DX?4,DY?16,2???0.5。求常数a使
EW最小,并求EW的最小值。
解:EW?EaX?6aXY?9Y22?222??a2EX2?6aE?XY??9EY2
2222由DX?EX??EX??EX?4;DY?EY??EY??EY?16
Cov?X,Y??E?XY??EX?EY?E?XY???DXDY??4
所以EW?4a?24a?144,为求极值关于a求导并另导数为0,有8a?24?0 从而得到a?3,此时EW?108
例2 设?X,Y?服从二维正态分布,且有DX??X,DY??Y,证明当a??X?Y222222时随机变量W?X?aY,V?X?aY相互独立。
证:由正态随机向量的性质,可知X和Y服从正态分布,并进一步有W和V也都服从正态分布,因此,W和V相互独立的充分必要条件为相关系数为0,即协方差为0。 Cov?W,V??Cov?X?aY,X?aY??EX?aY22?2??[?EX?2?a2?EY?]
222?DX?a2DY??X?a2?Y?0(由条件)
作业:P132 31、32、36
5