好文档 - 专业文书写作范文服务资料分享网站

(抽样检验)统计量与抽样分布

天下 分享 时间: 加入收藏 我要投稿 点赞

第六章 统计量及抽样分布

概率论和数理统计都是研究随机现象规律性的数学分支。

(1) 概率论特点:先提出随机现象的数学模型,然后研究其特性和规律 (2) 数理统计:

(3) I)以概率论为理论前提,从实际观测或试验出发; II) 研究如何有效的收集、整理和分析受到随机因素影响的数据,并为之建立适当的

数学模型;

III)对其进行检验,在此基础上对所研究的问题作出推断和预测,为采取行动和决策

提供依据和建议。

§1总体、样本与统计量

一、总体与样本

在实际问题中,我们往往只能通过观察和试验来获取研究对象的信息,但是,如果要把 全体研究对象逐个一一检查,常常是不必要或不可能的. 如:(1)对自动生产线上高速生产的零件逐个检查,要耗费很多的人力、物力、财力及时间,且非必要;

(2)为考察某些产品如灯泡的寿命,横梁的耐冲击强度等而进行的破坏性试验,逐个检查将使生产失去意义 所以,实际问题中,只能也只需通过测试部分对象的数据,由此来推断全体研究对象的性质,由部分推断总体。这是数理统计面对的基本问题。 1、 总体:研究对象的全体,如一批灯泡的寿命

具体:研究对象的某个或某几个特性的数量指标,所有的可能取值所构成的集合。

如,研究对象:一个城市的居民家庭;X:人均收入;Y:人均支出;Z:人均居住面积,

X??X1,X2,LXn...?则三个总体:?X,Y?? ??X,Y?,?X,Y?,L??X,Y,Z????X,Y,Z?,?X,Y,Z?,L?1122111222通常我们学习研究对象的一个特性的数量指标,所有可能取值所构成的集合。如,X:灯泡寿命,总体X??x1,x2,L?,其中灯泡是研究对象,寿命是数量指标。

2、 个体:组成总体的每一个基本单元(集合中的元素)

3、 样本:从总体中随机地抽取几个个体所组成地集合,称为总体地一个样本:

?X1,X2,LXn?,通常看为n维随机变量

(1) 样本容量:样本中所含个体地个数n,?n?1,2,L??总体中个体元素个数

(2) 样本值:X1,X2,LXn的一个观测,记为:x1,x2,Lxn

4、 抽样:从总体中抽取样本的过程。这里指随机抽样。目的:通过样本得到总体的相应情

况。

(1)简单随机抽样:数理统计最常用的抽样方法。

满足特点:代表性:总体中每个个体被抽入样本的机会均等,即每个Xi(个体)与总体X

具有相同分布;

独立性:样本中每个个体取什么值并不影响其它个体取什么值,即X1,X2,LXn相互独立。

(2)简单随机样本:简称样本(指用简单抽样方法获得的样本)。 即:X1,X2,LXn为简单随机样本????X1,X2,LXn相互独立;

X,X,LX与X具有相同的分布???12n?如,一批灯泡5万只,随机抽取1000只检查其寿命Xi,?i?1,2,L1000?,其中4只寿命低于规律值,为次品,总体X??X1,X2,LX50000?,一个样本X1,X2,LX1000,?样本的次品率为0.4%。可推断,总体的次品率为0.4%。

(4) 这里可得到简单随机样本的方式:通常采用

有放回地重复随机抽样:通常针对有限总体,尤其总体容量较小时;

无放回…………………:指无限总体或样本容量相对较少,如小于等于总体的5%时。 5、 样本X1,X2,LXn的联合密度函数p?x1,x2,Lxn??p?x1?p?x2?Lp?xn?,其中:总体X是

连续型随机变量,其密度函数为p?x?。 二、统计量

1、统计量:设X1,X2,LXn为取自总体X的一个样本,g?x1,x2,Lxn?为一个连续函数,且不含未知参数,则称g?x1,x2,Lxn?为统计量。

如:总体X~N??,?2?,X1,X2,LXn为取自总体X的一个样本, (1)?未知,?已知,则含?的不是;

(2)?未知,?未知,则含?或含?的不是;

简单地讲:统计量满足a)是样本X1,X2,LXn的实值函数;b)样本观测值?x1,x2,Lxn??,就可求出统计量的具体值。 2、常用统计量

设X1,X2,LXn为取自总体X的一个样本,

1n(1)样本均值:X??Xi

ni?11n(2)样本方差:S?Xi?X?n?1i?12??221n2 ?X?nX?in?1i?1??证明:(略)

1nXi?X(3)样本均方差(标准差):S??n?1i?1??2 样本方差S与均方差S都反映了总体波动的大小,即反映总体D?X?,D?X?的信息。

2例1、从一批袋装食品中随机抽取6袋,测得其重量(单位:克),如下:462,465,451,472,459,448。求样本均值X和样本方差S。

解:总体X:指这批食品的重量(各袋重量构成的集合); 样本?X1,X2,LX6?是抽取6袋食品的重量

样本值:(462,465,451,472,459,448)为这次抽取6袋食品测得的重量

2X?X2?L?X6462?465?L?44816??459.5 (1)X??Xi?16i?16622161?2222Xi?6X??X1?X2?LX6?6X?(2)S??? ?6?1i?15?2?? ?或S?214622?4652?L?4482?6?459.52??79.5 ?51?222462?459.5???465?459.5??L??448?459.5???79.5 ??5?§2样本分布函数

设x1,x2,Lxn为取自总体X的一组样本值,可用频率分布表和直方图粗略地描述总体

X地分布。

一、频率分布表

1、设总体X是离散型随机变量,x1,x2,Lxn是样本X1,X2,LXn地一组样本值。

X1,X2,LXn取到的值为a1,a2,Lam,且取到a1,a2,Lam的个数分别为v1,v2,Lvm,

(1)频数:ai出现的次数?i; (2)频率:fi??in,其中,n?v1?v2?L?vm,即n个数据中,取到ai值的频率、比例;

(3)频率分布表:可近似地反映(代替)总体X的分布律

X?ai a1 a2 L am P f1 f2 L fm

二、直方图

当总体X是连续型随机变量时,可采用直方图来处理样本值。 1、 方法:

***(1)将样本值x1,x2,Lxn从小到大排列,x1,x2,Lxn?样本值落入区间

?a,b???x小数。

*1,xn*?,a略小于x1*,比x1*通常多一位小数;b略小于xn*,比xn*通常多一位

(2)将n个样本值的各个不同取值所在的区间a,b??m?1?等分

?m?1?等分,使am的值落入分割的小区间中,a?t0?t1?t2?L?tm?tm?1?b,每一小区间长度:ti?1?ti??b?a,?i?0,1,Lm? m?1m 大小,通常与样本容量对应,

(3)依次数出样本值落在区间ti,ti?1?中的个数?i,?i?0,1,Lm?

?fi??in——为样本值落入区间ti,ti?1?中的频率;

?(4)画出(频率)直方图:每个直方条:宽ti,ti?1?,长

?fi

ti?1?tifi?fi??ti?1?ti??S小矩形?P?ti?x?ti?1?

ti?1?ti(5) 相应密度函数的大致曲线:光滑连接每条长方形上边中点。 三、样本分布函数

由样本的分布函数,推断(近似得出)总体X的分布函数。

***作法:将一组来自总体X的样本值x1,x2,Lxn,从小到大排列x1?x2?L?xn

?0,x?x1*???1,x*?x?x*2?n1??? Fn?x???2,x2*?x?x3*,Fn?x?――称样本分布函数通常n越大,近似程度越好。

?n?M?*?1,x?xn??§3常用统计量的分布

四种常用的统计量及其分布 一、X的分布

1、定理:设X1,X2,LXn是取自正态总体X的样本。X~N??,??,则有:样本均值

2??2?X??~N?0,1? X~N??,?, ??n??n样本X1,X2,LXn独立与X同分布,E?Xi???,D?Xi???2,

?X?1?X1?X2?LXn?也服从正态分布, n11?EX?E?X1?X2?LXn???n???,

nn11DX?2D?X1?X2?LXn??2?n?2??2

nn????例1、设总体X~N?12,4?,抽取容量为16的样本。求样本平均值X的分布及PX?13 解:X~N?12,4?,n?16 (1)X~N?,?(2)

???21?12,??N???,即X服从参数??12,?4??2?1的正态分布; 4???13?12?PX?13?1?PX?13?1?F?13??1????1???2??1?0.9772?0.02281????2?????二、?-分布

1、定义:若随机变量X1,X2,LXn相互独立,都服从同分布,Xi~N?0,1?,则称随机变

222222量X?X1?X2?L?Xn??服从自由度n的?分布,记:X~?(n)

2(1)X~?(n),X的密度函数图形

2?2-分布的密度曲线是个对称的,其形状与自由度n有关,随自由度n的增大而渐趋于对

称。

(2)?-分布:已知自由度n,给定正数???0,1?,

2由?分布表?临界值???PX???2?? 例2、设随机变量X~?(20),求下列情况下的k (1)P?X?k??0.05,

解:n?20,??0.05,查表:P?X?31.41??0.05,?k?31.41——即临界值??

222??22、 定理:设X1,X2,LXn是取自总体X的样本,X~N??,??,则样本均值X和样本

2

5w35b7z7ea1wxgu8k8be9y6ym8c7oz00mue
领取福利

微信扫码领取福利

微信扫码分享