统计学常用分布及其分
位数
Document number:NOCG-YUNOO-BUYTT-UU986-1986UT
§ 常用的分布及其分位数
1. 卡平方分布
卡平方分布、t分布及F分布都是由正态分布所导出的分布,它们与正态分布一起,是试验统计中常用的分布。
当X1、X2、…、Xn相互独立且都服从N(0,1)时,Z=?Xi 的分布称为自由度等于n的?2分布,记作Z~
inz?1?1??nx2e2,z?02 ?(n),它的分布密度 p(z)=??n??22?????2??0,其他,?2式中的???=?0u?2??n??2???n?1?u2edu,称为Gamma函数,且
1???1?=1, ????=π。?2分布是非对称分布,具有可加性,
即当Y与Z相互独立,且Y~?2(n),Z~?2(m),则Y+Z~?2(n+m)。
证明: 先令X1、X2、…、Xn、Xn+1、Xn+2、…、Xn+m相互独立且都服从N(0,1),再根据?2分布的定义以及上述随机变量的相互独立性,令
22+X2++X2,Z=X2+X2 Y=X1n?1n?2+…+Xn?m, 2…n22+X2++X2+ X2+X2 Y+Z= X1n?1n?2+…+Xn?m, 2…n 即可得到Y+Z~?2(n+m)。
2. t分布 若X与Y相互独立,且
X~N(0,1),Y~?2(n),则Z =Xn?1?1?(n2)?z2???1??2 。 n??n?n?(2)?Yn 的分布称为自由度等于n的t分布,记作Z ~ t (n),它的分布密度 P(z)=
请注意:t分布的分布密度也是偶函数,且当n>30时,t分布与标准正态分布N(0,1)的密度曲线几乎重叠为一。这时, t分布的分布函数值查N(0,1)的分布函数值表便可以得到。
3. F分布 若X与Y相互独立,且X~?2(n),Y~?2(m),
X 则Z=
nY的分布称为第一自由度等于n、第二自由度等m?nmnn?m??n2m2???1???z2?2???,z?0 p(z)=?n?m?n??m????????(m?nz)2?2??2???0,其他。?于m的F分布,记作Z~F (n, m),它的分布密度
请注意:F分布也是非对称分布,它的分布密度与自由度的次序有关,当Z~F (n, m)时,4. t分布与F分布的关系 若X~t(n),则Y=X~F(1,n)。
证:X~t(n),X的分布密度
p(x)=
?n?1????2???n?nπ????2?n?1?x2???1??2 。 ??n??21~F (m ,n)。 Z Y=X2的分布函数FY(y) =P{Y 当y?0时,FY(y)=0,pY(y)=0; 当y>0时,FY(y) =P{-y =??2yyp(x)dx=2?0p(x)dx, n1?1?n??1n2???2y?2??pY(y)= 1?n?1??n????????2??2?(n?y)22y Y=X的分布密度, 与第一自由度等于1、第二自由度等于n的F分布的分布密度相同,因此Y=X~F(1,n)。 为应用方便起见,以上三个分布的分布函数值都可以从各自的函数值表中查出。但是,解应用问题时,通常是查分位数表。有关分位数的概念如下: 4. 常用分布的分位数 1)分位数的定义 分位数或临界值与随机变量的分布函数有关,根据应用的需要,有三种不同的称呼,即α分位数、上侧α分位数与双侧α分位数,它们的定义如下: 当随机变量X的分布函数为 F(x),实数α满足0 <α<1 时,α分位数是使P{X< xα}=F(xα)=α的数xα, 上侧α分位数是使P{X >λ}=1-F(λ)=α的数λ, 双侧α分位数是使P{X<λ1}=F(λ1)=α的数λ1、使 P{X>λ2}=1-F(λ2)=α的数λ2。 因为1-F(λ)=α,F(λ)=1-α,所以上侧α分位数λ就是1-α分位数x 1-α; F(λ1)=α,1-F(λ2)=α,所以双侧α分位数λ1就是α分位数x α,双侧α分位数λ2就是α分位数x α。 2)标准正态分布的α分位数记作uα,α分位数记作u α,α分位数记作 u α。 当X~N(0,1)时,P{X< uα}=F 0,1(uα)=α, P{X 根据标准正态分布密度曲线的对称性, 当α=时,uα=0; 当α<时,uα<0。 uα=-u 1-α。 如果在标准正态分布的分布函数值表中没有负的分位数,则先查出 u 1-α,然后得到uα=-u 1-α。 论述如下:当X~N(0,1)时,P{X< u α}= F 0,1 (u α)=α, P{X< u 1-α}= F 0,1 (u 1-α)=1-α, P{X> u 1-α}=1- F 0,1 (u 1-α)=α, 故根据标准正态分布密度曲线的对称性,uα=-u 1-α。 例如,u =-u =, u =-u =,