f(x)=
所以似然函数为:
L(μ,σ2)=
1e2π??(x??)22?2,
?i?1n?(xi??)2??1??1n12?exp???exp?(x??)????? i22?2?2?2π?i?1?????2π??2
nnn1n22lnL(μ,σ)=?ln2π?ln??. (x??)?i2222?i?1故似然方程组为:
??lnL(?,?2)1n?2?(xi??)?0,?????i?1 ?2n?lnL(?,?)n1???2?(xi??)2?0.24????2?2?i?1?解以上方程组得:
?1n???xi?x,??ni?1 ?nn11??2??(xi??)2??(xi?x)2??B2.?nni?1i?1?所以 ???X,?? 2???L?B2.例7.8 设总体X服从[0,θ]上的均匀分布,X1,X2,…,Xn是来自X的样本,求θ的矩法
估计和极大似然估计.
解 因为E(X)=θ/2,令X=E(X),得
??2X. ?矩?1?,0?x??,又 f(x)=??
?其他.?0,所以L(θ)=
1,0≤xi≤θ. n?1?i?n??max?X?. 要L(θ)最大,θ必须尽可能小,又θ≥xi,i=1,2,…,n,所以?Li
第二节 估计量的评价标准
??2X,??max?X? 设总体X服从[0,θ]上的均匀分布,由上节例7可知?矩Li1?i?n都是θ的估计,这两个估计哪一个好?下面我们首先讨论衡量估计量好坏的标准问题.
1.无偏性
定义7.2 若估计量(X1,X2,…,Xn)的数学期望等于未知参数θ,即:
?)??, (7.6) E(?则称??为θ的无偏估计量(Non-deviation estimator).
估计量??的值不一定就是θ的真值,因为它是一个随机变量,若??是θ的无偏估计,则尽管??的值随样本值的不同而变化,但平均来说它会等于θ的真值.
1n例7.9 设X1,X2,…,Xn为总体X的一个样本,E(X)=μ,则样本平均数X??Xini?1是μ的无偏估计量.
证 因为E(X)=μ,所以E(Xi)=μ,i=1,2,…,n,于是
?1n?1nE(X)?E??Xi???E(Xi)=μ.
?ni?1?ni?1所以X是μ的无偏估计量.
例7.10 设有总体X,E(X)=μ,D(X)=σ2,(X1,X2,…,Xn)为从该总体中抽
1n得的一个样本,样本方差S及二阶样本中心矩B2=?(Xi?X)是否为总体方差σ2的无
ni?12
偏估计?
解 因为E(S2)=σ2,所以S2是σ2的一个无偏估计,这也是我们称S2为样本方差的理由.由于
n?12S, nn?1n?12E(S2)??, 那么 E(B2)=nnB2=
所以B2不是σ2的一个无偏估计.
还需指出:一般说来无偏估计量的函数并不是未知参数相应函数的无偏估计量.例如,当X~N(μ,σ2)时,X是μ的无偏估计量,但X不是μ2的无偏估计量,事实上:
2E(X)?D(X)???E(X)???22?2n??2??2.
2.有效性
?与??,即E(??)=E(??)=θ,那么在??,对于未知参数θ,如果有两个无偏估计量?12121?中谁更好呢?此时我们自然希望对θ的平均偏差E(??-θ)2越小越好,即一个好的估计?2量应该有尽可能小的方差,这就是有效性.
?和??都是未知参数θ的无偏估计,若对任意的参数θ,有 定义7.3 设?12?)≤D(??)D(?12, (7.7)
?比??有效. 则称?12?比??有效,则虽然??还不是θ的真值,但??在θ附近取值的密集程度较??高,如果?12112?估计θ精度要高些. 即用?11n例如,对正态总体N(μ,σ),X??Xi,Xi和X都是E(X)=μ的无偏估计
ni?12
量,但
?2D(X)=≤D(Xi)=σ2,
n故X较个别观测值Xi有效.实际当中也是如此,比如要估计某个班学生的平均成绩,可用两种方法进行估计,一种是在该班任意抽一个同学,就以该同学的成绩作为全班的平均成绩;另一种方法是在该班抽取n位同学,以这n个同学的平均成绩作为全班的平均成绩,显然第二种方法比第一种方法好.
3.一致性
无偏性、有效性都是在样本容量n一定的条件下进行讨论的,然而(X1,X2,…,Xn)不仅与样本值有关,而且与样本容量n有关,不妨记为n,很自然,我们希望n越大时,n对θ的估计应该越精确.
定义7.4 如果n依概率收敛于θ,即?ε>0,有
??????1,,limP?(7.8) nn?????是θ的一致估计量(Uniform estimator). 则称?n由辛钦大数定律可以证明:样本平均数X是总体均值μ的一致估计量,样本的方差及二阶样本中心矩B2都是总体方差σ2的一致估计量.
S2
第三节 区间估计
1.区间估计的概念
上节我们介绍了参数的点估计,假设总体X~N(μ,σ2),对于样本(X1,X2,…,Xn),
??X是参数μ的矩法估计和极大似然估计,并且满足无偏性和一致性.但实际上X=μ的??=μ的可能性为0,为此,可能性有多大呢?由于X是一连续型随机变量,P{X=μ}=0,即?我们希望给出μ的一个大致范围,使得μ有较高的概率在这个范围内,这就是区间估计问题.
?(X1,X2,…,Xn)及?? (X1,X2,…,Xn)是两个统计量,如果对于给定的概定义7.5 设?12率1-α(0<α<1),有:
?<θ<??}=1-α, (7.9) P{?12?,??)为参数θ的置信区间(Confidence interval)?称为置信下限,??则称随机区间(?,?1212称为置信上限,1-α叫置信概率或置信度(Confidence level).
?,??)的大小依赖于随机抽取的样本观测值,它可能包含θ,定义中的随机区间(?12?,??)以1-α的概率包含θ.例如,若取α=0.05,也可能不包含θ,(7.9)式的意义是指(?12?,??)的意义是指:在100次重复抽样中那么置信概率为1-α=0.95,这时,置信区间(?12所得到的100个置信区间中,大约有95个区间包含参数真值θ,有5个区间不包含真值θ,
?,??)包含参数θ真值的频率近似为0.95. 亦即随机区间(?12例7.11 设X~N(μ,σ2),μ未知,σ2已知,样本X1,X2,…,Xn来自总体X,求μ的置信区间,置信概率为1-α.
解 因为X1,X2,…,Xn为来自X的样本,而X~N(μ,σ2),所以u=X?? ~N(0,1),
?/n?X???P?z对于给定的α,查附录中表2可得上分位点z?,使得???=1-α,即 22?/n??????P?X?z????X?z??=1-α. 22nn??所以μ的置信概率为1-α的置信区间为
????X?z,X?z????. (7.10) 22nn??由(7.10)式可知置信区间的长度为2z??n,若n越大,置信区间就越短;若置信概率
2
1-α越大,α就越小,z?就越大,从而置信区间就越长.
22.正态总体参数的区间估计
由于在大多数情况下,我们所遇到的总体是服从正态分布的(有的是近似正态分布),故我们现在来重点讨论正态总体参数的区间估计问题.
在下面的讨论中,总假定X~N(μ,σ2),X1,X2,…,Xn为其样本. (1) 对μ的估计 分两种情况进行讨论. (a) σ2已知
此时就是例7.11的情形,结论是:μ的置信区间为
????X?z,X?z????, 22nn??置信概率为1-α.
(b) σ2未知
当σ2未知时,不能使用(7.10)式作为置信区间,因为(7.10)式中区间的端点与σ
1nX??22
有关,考虑到S=是σ的无偏估计,将中的σ换成S得 (X?X)?in?1i?1?/n2
T=X?? ~t(n-1).
S/n对于给定的α,查附录中t分布表4可得上分位点tσ/2(n-1),使得
?X???P??t?(n?1)?=1-α,
2?S/n?即
SS??P?X?t?(n?1)???X?t?(n?1)?=1-α.
n2n2??所以μ的置信概率为1-α的置信区间为
SS??X?t(n?1),X?t(n?1)????. (7.11) 22nn??1nS0S(Xi?X)2,所以μ的置信区间也可写成 ?由于,S0=?ni?1nn?1S0S0??X?t(n?1),X?t(n?1)????.(7.12) 22n?1n?1??例7.12 某车间生产滚珠,已知其直径X~N(μ,σ2),现从某一天生产的产品中随机地抽
出6个,测得直径如下(单位:毫米)
14.6 15.1 14.9 14.8 15.2 15.1
试求滚珠直径X的均值μ的置信概率为95%的置信区间.