好文档 - 专业文书写作范文服务资料分享网站

统计学-贾俊平-考研-知识点总结

天下 分享 时间: 加入收藏 我要投稿 点赞

(4)正态分布的标准差?为大于0的实数,他决定正态曲线的“陡峭“或”扁平“程度。?越大,正太曲线越扁平;?越小,正太曲线越陡峭。

(5)当X的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐进横轴,但理论上永远不会与之相交。

(6)与其他连续型随机变量相同,正太随机变量在特定区间上的取值概率由正太曲线下的面积给出,而且其曲线下的面积等于1

? 经验法则:

? 正态随机变量落入其均值左右各1个标准差内的概率是

68.27%

? 正态随机变量落入其均值左右各2个标准差内的概率是

95.45%

? 正态随机变量落入其均值左右各3个标准差内的概率是

99.73%

三、数据正态性的评估方法:

(1)、对数据画出频数分布的直方图或茎叶图。若数据近似服从正态分布,则图形的形状与上面给出的正太曲线应该相似 (2)、求出样本数据的四分位差Qd/s≈1.3.

(3)、对数据作正太概率图。若数据近似服从正态分布,则数据点将落在一条近似直线上

四、什么条件下用正态分布分布近似计算二项分布的效果较好

当样本容量n越来越大时,二项分布越来越近似服从正太分布,这时,二项随机变量的直方图的形状接近正太分布的图形形状。

即使对于小样本,当p=0.5时,二项分布的正太近似仍然相当好,此时随机变量X的分布是相对是相对于其平均值?=np对称的。当平p趋于0或1时,二项分布将呈现出偏态,但当n变大时,这种偏斜就会消失。一般来说,只有当n大到使np和n(1-p)大于或等于5时,近似的效果就相当好。

五、均匀分布的直观概率意义:

将区间〔a,b〕划分为任意多个小区间。随机变量X在任何小区间上取值的概率大小与该小区间的长度成正比,而与该小区间的具体位置无关。

第六章 抽样与抽样分布

一、比较分层抽样、系统抽样和整群抽样

(1)分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。优点:a、保证样本的结构与总体的结构比较相近,从而提高估计的精度b、组织实施调查方便c、既可以对总体参数进行估计,也可以对各层的目标量进行估计。d、分层抽样的样本分布在各个层内,从而使样本在总体中的分布比较均匀

(2)系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位。 优点:操作简便,系统抽样的样本在总体中的分布一般也比较均匀,由此抽样误差通常要小于简单随机抽样,提高估计的精度 缺点:对估计量方差的估计比较困难 (3)整群抽样是指将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查 优点是:不需要有总体的具体名单而只要有群的名单就可以进行抽样,而群的名单比较容易得到;此外调查的地点相对集中,节省调查费用,方便调查的实施 缺点是估计的精度较差

二、比较三种不同性质的分布

(1)总体分布指总体中各元素的观察值所形成的相对频数的分布。分布通常是未知的,可以假定它服从某种分布

(2)样本分布是指从总体中抽取一个容量为n的样本,由这n个观察值形成的相对频数分布。也称经验分布 。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布

(3)从一般意义上说,抽样分布是指样本统计量的概率分布,样本统计量的概率分布。随机变量是 样本统计量 ,如样本均值, 样本比例,样本方差等。结果来自容量相同的所有可能样本;提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据

三、中心极限定理

随着样本容量n的增大(n>=30),不论原来的总体是否服从正态分布,样本值的抽样分布都趋于正态分布,其分布的数学期望为总体均值?,方差为总体方差的1/n,这就是中心极限定理,表述为:设从均值为?,方差为? 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布

四、重复抽样和不重复抽样相比,抽样均值分布的标准差有何不同

样本均值的方差与抽样方法有关,在重复抽样条件下,样本均值的方差为总体方差的1/n,即

?22??n22XX在不重复抽样条件下,样本均值的方差则需要用修正系数去修正重复抽样时样本均值的方差,即

?22XX2?2??N?n???n?N?1?不重复抽样的样本均值的方差小于重复抽样时的样本均值的方差

对于无限总体进行不重复抽样时,可以按照重复抽样来处理,对于有限总体,当 N很大,而抽样比n/N很小时,其修正系数趋于1,这时样本均值的方差也可以按照重复抽样的样本均值的方差公式来计算

五、?2分布的性质和特点

(1)分布的变量值始终为正

(2)分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称

(3)期望为:E(?2)=n,方差为:D(?2)=2n(n为自由度)

(4)可加性:若U和V为两个独立的?2分布随机变量,U~?2(n1), V~?2(n2),则

U+V这一随机变量服从自由度为n1+n2的?2分布

第七章 参数估计

一、评价估计量的标准

实际上,用于估计的

?的估计量有很多,如我们可以用样本均值作为总体均值

的估计量,也可以用样本中位数作为总体均值的估计量,什么样的估计量才算是一个好的估计量呢?这需要一定的评价标准:

1、无偏性:估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为?,被选择的估计量为计量。

???,如果E(?)=?,称

???为

的无偏估

2、有效性:对同一总体参数的两个无偏估计量,方差较小的是更有效的估计量。

3、一致性:随着样本容量的增大,点估计量的值越来越接近被估的总体的参数。换言之,一个大样本给出的估计量要比一个小样本给出的估计量更接近总体的参数

二、怎样理解置信区间

置信区间:由样本统计量所构造的总体参数的估计区间,其中区间的最小值称为置信下限,区间最大值称为置信上限。是一个随机区间,

间意味着,置信区间包含未知参数的概率为不同而不同。但100次运用这个区间,约有100(就是说大约还有100 a个区间不包含总体参数

判断置信区间优势的标准(好的置信区间的特性):置信度越高越好;置信区间宽度越小越好。

的置信区

,这个区间会随着样本观察值的

)个区间能包含参数,也

三、影响区间宽度的因素

1. 总体数据的离散程度,用 s 来测度

2. 样本容量:当置信水平固定时,置信区间的宽度随着样本容量的增大而减小,

换言之,较大的样本所提供的有关总体的信息要比小样本多。 3. 置信水平 (1 - a),影响 z 的大小 :置信水平越大,z越大

四、简述样本容量与置信水平、总体方差、估计误差的关系??=

(???????)

??????

(1)样本量与置信水平呈正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大

(2)样本量与总体方差呈正比,总体的差异越大,所需的样本容量就越大 (3)样本量与边际误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量就越小

五、???? ????√??的含义是什么?

Zα 是标准正态分布上侧面积为时的z值。Zα

2α2σ是估计总体均值时的边际误差,2√n也称为估计误差或误差范围

六、对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定

(1)两个总体都服从正态分布

(2)两个随机样本独立地分别抽自两个总体

七、解释95%的置信区间

抽取100个样本,根据每个样本构造一个置信区间,这样由100个样本构造的总体参数的100个置信区间中,95%的区间包含了总体参数的真值,而5%没包含 八、对于总体比例的估计,确定样本容量是否“足够大“的一般经验规则是:区间p?2√p(1?p)?2中不包含0或1.或要求np≥5和n(1-p)≥5

八、独立样本和匹配样本

如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立,则称为独立样本。匹配样本是指一个样本中的数据与另一个样本中的数据相对应

九、估计量和估计值

(1)估计量:用于估计总体参数的随机变量

? 如样本均值,样本比例、样本方差等

? 例如: 样本均值就是总体均值m 的一个估计量 参数用? 表示,估计量用

?? 表示

(2)估计值:估计参数时计算出来的统计量的具体值

? 如果样本均值 ?x =80,则80就是m的估计值

统计学-贾俊平-考研-知识点总结

(4)正态分布的标准差?为大于0的实数,他决定正态曲线的“陡峭“或”扁平“程度。?越大,正太曲线越扁平;?越小,正太曲线越陡峭。(5)当X的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐进横轴,但理论上永远不会与之相交。(6)与其他连续型随机变量相同,正太随机变量在特定区间上的取值概率由正太曲线下的面积给出,而且其曲线下的面积等于1
推荐度:
点击下载文档文档为doc格式
68q1i79qg76h1tx45d7638ccg96n4k006zw
领取福利

微信扫码领取福利

微信扫码分享