(n·p>=5且n(1-p)>=5)满足时,和p相关的样本为大样本),样本比例抽样分布趋向于以样本期望值为中心、以样本方差为方差的正态分布 1、期望值(Expectedvalueofp):E(p)=P 2、标准差(Standarddeviationofp):
重复抽样:不重复抽样:
*四、样本方差的抽样分布
要用样本方差s2去推断总体的方差σ2,必须知道样本方差的分布。
设总体服从正态分布X~N(μ,σ2),X1,X2,…,Xn为来自该正态总体的样本,统计证明比值的抽样分布为自由度是(n-1)的分布,即: ~
分布的性质:
(1)、分布的变量始终为正; (2)、分布的期望为,方差为。
第二节参数估计的基本方法
壹、估计量和估计值
参数是总体的数值特征(Aparameterisanumericalcharacteristicofapopulation。) 参数估计:就是用样本统计量去估计总体的参数。
数字特征 均值 比例 方差 总体参数() 样本统计量() 壹个总体 估计量()(estimator)用于估计总体某壹参数的样本统计量(随机变量)的名称。
样本均值,样本比例、样本方差等都能够是壹个估计量。
估计值(estimate):用来估计总体参数时计算出来的估计量的具体数值。
例如:样本均值就是总体均值的壹个估计量
如果样本均值?=3,则3就是的估计值
二、点估计和判断估计量的优良性准则 (壹)、点估计
点估计(PointEstimate)就是用样本估计量的值直接作为总体参数的估计值。 设是总体分布中壹个要估计的参数。例如,总体分布的均值、方差等。当下从总体中得到壹个随机样本,如何估计? 记估计的估计量(统计量)为,简记为
若得到壹组样本观察值,就能够得到的估计值:,也记为。 总体分布参数的点估计,就是求出的估计值。
点估计的方法壹般有矩估计发法、极大似然估计法等。 概念要点:
1.从总体中抽取壹个样本,根据该样本的统计量对总体的未知参数作出壹个数值点的估计。
例如:用样本均值作为总体未知均值的估计值就是壹个点估计 2.点估计没有给出估计值接近总体未知参数程度的信息 3.其理论基础是抽样分布 (二)、估计量的优良性准则
要估计总体的某壹指标,且非只能用壹个样本指标,而可能有多个指标可供选择,即对同壹总体参数,可能会有不同的估计量。作为壹个好的估计量,估计量必须具有如下性质:无偏性、有效性、壹致性。
1、无偏性(Unbiasedness):样本估计量的数学期望(均值)等于被估总体参数的真值;
如果,则称为的无偏估计量。
能够证明,总体方差的样本矩估计量是无偏估计量。 2、有效性(Efficiency):好的点估计量应具有较小的方差;
在用估计量来估计总体的某个参数时,如果对其它所有对的估计量总是有: 那么,这个估计量就是总体参数的有效估计量。
3、壹致性(Consistency):随着样本容量的增大,估计量越来越接近被估计的总体
参数。 如果满足:,即: 则称为的壹致估计量。
能够证明:样本均值、样本比例、样本标准差的点估计是无偏、有效、壹致的。 三、抽样误差和区间估计
(壹)、抽样误差(SamplingError)
壹个样本能够得到总体参数的壹个点估计,该点估计值和总体参数真值之间的差异,即为抽样误差。 有三个相互联系的概念:
1、实际抽样误差:具体样本的估计值和总体参数的实际值之间的离差。 2、抽样平均误差:所有可能样本估计值和相应总体参数的平均差异程度。
3、抽样极限误差壹定概率下抽样误差的可能范围(也称允许误差): 注意:
①、统计学上往往用抽样极限误差来测度抽样误差的大小或者说测度点估计的精度。原因:总体参数值往往且不知道,因此,实际抽样误差和抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限误差是能够估计出来的。 ②、抽样平均误差是所有可能样本值和总体指标值之间的平均离差,它表明抽样估计的准确度;而抽样极限误差是样本指标值和总体指标值的离差绝对值是表明抽样估计的准确程度的范围。这也就决定了俩者存在壹定的联系。通常,把抽样极限误差和抽样平均误差相比,从而使单壹样本的抽样极限误差标准化,壹般称为概率度或相对误差范围,即置信度。
③抽样极限误差的估计总是要和壹定的概率保证程度联系在壹起的。原因:样本统计量往往是壹随机变量,它和总体参数真值之差也是壹个随机变量,因此就不能期望某次抽样的样本估计值落在壹定区间内是壹个必然事件,而只能给予壹定的概率保证。因此,在进行抽样估计时,既需要考虑抽样误差的可能范围,同时仍需考虑落到这壹范围的概率大小。前者是估计的准确度问题,后者是估计的可靠性问题,俩者紧密联系不可分开。这也正是区间估计所关心的主要问题。 (二)、区间估计(IntervalEstimate)
在点估计的基础上,给出总体参数估计的壹个范围,称为参数的区间估计。 若总体分布含壹个未知参数,找出了俩个依赖于样本的估计量: 使得
其中,,显著性水平壹般取0.05或0.01,则称随机区间为的100(1-)%的置信
区间。百分数100(1-)%被称为置信度或置信水平。 1.根据壹个样本的观察值给出总体参数的估计范围
给出总体参数落在这壹区间的概率
例如:总体均值落在50~70之间,置信度为95% 2、置信水平
①.总体未知参数落在区间内的概率
②.表示为(1–a),a为显著性水平,是总体参数未在区间内的概率③.常用的显著性水平值有99%,95%,90%,相应的a为
。
3、区间估计的要点
①.依据样本指标和抽样误差去推算总体指标时,只是确定了总体指标的估计范围,且没有确定其具体值。这个范围表现为壹个上限和壹个下限,从而构成壹个区间。
②.所得的估计区间表示的只是壹个可能范围,而不是绝对的范围。总体指标在这个范围内的可能性为置信概率()。
③.扩大抽样极限误差能够提高抽样推断的可靠程度,但准确程度会降低;反之,缩小抽样极限误差会降低抽样推断的可靠程度,但准确程度会提高。
,
,
第三节壹个总体参数的区间估计
4.3.1总体均值的区间估计
1、区间估计的基本原理
以总体均值的区间估计为例来说明区间估计的基本原理。