第三章 正态分布
一、教学大纲要求
(一) 掌握内容
1.正态分布的概念和特征 (1)正态分布的概念和两个参数; (2)正态曲线下面积分布规律。 2.标准正态分布
标准正态分布的概念和标准化变换。 3.正态分布的应用 (1)估计频数分布; (2)制定参考值范围。 (二) 熟悉内容 标准正态分布表。 (三) 了解内容
1.利用正态分布进行质量控制 2.正态分布是许多统计方法的基础
二、教学内容精要
(一)正态分布 1.正态分布
若X的密度函数(频率曲线)为正态函数(曲线) f(X)?1?2?e?(X??)2(2?2)???X??? (3-1) 2则称X服从正态分布,记号X~N(?,?)。其中?、?是两个不确定常数,是正态分布的参数,不同的?、不同的?对应不同的正态分布。 正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。 2.正态分布的特征
服从正态分布的变量的频数分布由?、?完全决定。
(1)?是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以x??为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于?。
(2)?描述正态分布资料数据分布的离散程度,?越大,数据分布越分散,?越小,数据分布越集中。?也称为是正态分布的形状参数,?越大,曲线越扁平,反之,?越小,曲线越瘦高。
(二)标准正态分布
1.标准正态分布是一种特殊的正态分布,标准正态分布的??0,?(或Z)表示服从标准正态分布的变量,记为u~N(0,1)。
22?1 ,通常用u2.标准化变换:u?X???,此变换有特性:若X服从正态分布N(?,?),则u就服
2从标准正态分布,故该变换被称为标准化变换。
3. 标准正态分布表
标准正态分布表中列出了标准正态曲线下从-∞到u范围内的面积比例?(u)。 (三)正态曲线下面积分布
1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同(X1,X2)范围内正态曲线下的面积可用公式3-2计算。
D??其中,u1?X1??X21X1?2?e?(X??)2(2?2)dx??(u2)??(u1) (3-2)
? , u2?X2???。
2.几个重要的面积比例
正态曲线下,横轴区间???内的面积为68.27%,X轴与正态曲线之间的面积恒等于1。
横轴区间??1.64?内的面积为90.00%,横轴区间??1.96?内的面积为95.00%,横轴区间??2.58?内的面积为99.00%。 (四)正态分布的应用
某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式(3-2)估计任意取值(X1,X2)范围内频数比例。
2. 制定参考值范围
(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
表3-1 常用参考值范围的制定
正态分布法 百分位数法
概率
单 侧 单侧
(%) 双侧 双侧
下 限 上 限 下 限 上 限 90 P5~P95 P10 P90 X?1.64S X?1.28S X?1.28S 95 99
3. 质量控制:为了控制实验中的测量(或实验)误差,常以X?2S作为上、下警戒值,以X?3S作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
4. 正态分布是许多统计方法的理论基础。t检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布
X?1.96S X?2.58S
X?1.64S X?2.33S
X?1.64S X?2.33S
P2.5~P97.5 P0.5~P99.5
P5 P95 P99
P1
为理论基础的。
三、典型试题分析
1.正态曲线下、横轴上,从均数到??的面积为( )。
A.95% B.50% C.97.5% D.不能确定(与标准差的大小有关) 答案:B
[评析] 本题考点:正态分布的对称性
因为无论?,?取什么值,正态曲线与横轴间的面积总等于1,又正态曲线以X??为对称轴呈对称分布,所以?左右两侧面积相等,各为50%。
2.若X服从以?,?为均数和标准差的正态分布,则X的第95百分位数等于( )。 A.??1.64? B.??1.64? C.??1.96? D.??2.58? 答案:B
[评析] 本题考点:正态分布的对称性和面积分布规律
正态分布曲线下??1.64?范围内面积占90%,则??1.64?外的面积为10%,又据正态分布的对称性得,曲线下横轴上小于等于??1.64?范围的面积为95%,故X的第95百分位数等于??1.64?。
3.若正常成人的血铅含量X 近似服从对数正态分布,拟用300名正常人血铅值确定99%参考值范围,最好采用公式( )计算。(其中Y=logX) A. X?2.58S B.X?2.33S
C.log(Y?2.58SY) D.log(Y?2.33SY)
答案:D
[评析] 本题考点:对数正态分布资料应用正态分布法制定参考值范围
根据题意,正常成人的血铅含量X 近似对数正态分布,则变量X 经对数转换后所得新变量Y应近似服从正态分布,因此可以应用正态分布法估计Y 的99%参考值范围,再求反对数即得正常成人血铅含量X 的99%参考值范围。因血铅含量仅过大为异常,故相应的参考值范围应是只有上限的单侧范围。正态分布法99%范围单侧上限值是均数+2.33倍标准差。
4.正常成年男子红细胞计数近似正态分布,95%参考值范围为3.60~5.84(?10/L)。若一名成年男子测得红细胞计数为3.10(?10[评析] 本题考点:参考值范围的涵义
该成年男子不一定有病。因为参考值范围是指绝大多数正常人的指标值范围,故不在此范围内的对象也可能是正常人。
5.假定正常成年女性红细胞数(?10/L)近似服从均值为4.18,标准差为0.29的正态分布。令X代表随机抽取的一名正常成年女性的红细胞数,求: (1) 变量X落在区间(4.00,4.50)内的概率; (2) 正常成年女性的红细胞数95%参考值范围。 [评析] 本题考点:正态分布的应用
(1)根据题意,变量X近似服从正态分布,求变量X落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量X进行标准化变换后,借助标准正态分布表求其面积,具体做法如下:
121212?1?1/L),则医生判断该男子一定有病。
P(4.00?X?4.50)?P(
变量X落在区间(4.00,4.50)内的概率为0.5967。
4.00?4.18X??4.50?4.18??)
0.29?0.29?P(?0.62?u?1.10) ?1??(?1.10)??(?0.62) ?1?0.1357?0.2676 ?0.5967
(2)问题属于求某个指标的参考值范围问题,因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该指标过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:
12下限为:X?1.96??4.18?1.96(0.29)?3.61(?10/L) 12上限为:X?1.96??4.18?1.96(0.29)?4.75(?10/L)
95%的正常成年女性红细胞数所在的范围是3.61~4.75(?10
12/L)。
四、习 题
(一)单项选择题
1.标准正态分布的均数与标准差分别为( )。 A.0与1 B.1与0 C.0与0 D.1与1
2.正态分布有两个参数?与?,( )相应的正态曲线的形状越扁平。 A.?越大 B.?越小 C.?越大 D.?越小
3.对数正态分布是一种( )分布。
A.正态 B.近似正态 C.左偏态 D.右偏态
4.正态曲线下、横轴上,从均数-1.96倍标准差到均数的面积为( )。 A.95% B.45% C.97.5% D.47.5%
5.标准正态分布曲线下中间90%的面积所对应的横轴尺度u的范围是( )。 A.-1.64到+1.64 B.??到+1.64 C.??到+1.28 D.-1.28到+1.28 (二)名词解释 1.正态曲线
2.正态分布 3. 标准正态分布 4. 标准化变换 (三)简答题
1.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。 2.正态分布、标准正态分布与对数正态分布的联系与区别。
3.对称分布在“X ? 1.96S标准差”的范围内,也包括95%的观察值吗? (四)计算题
1.假定 5岁男童的体重服从正态分布,平均体重?=19.5(kg),标准差?=2.3(kg)。 (1)随机抽查一5岁男童的体重,计算概率: ①其体重小于16.1 kg
②其体重大于22.9 kg
③其体重在14.6 kg到23.9 kg之间
(2)试找出最重的5%、10%、2.5% 5岁男童的体重范围。
2.某年某地测得200名正常成人的血铅含量(?g/100g)如下,试确定该地正常成人血铅含量的95%参考值范围。
3 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 14 14 15 15 15 15 15 15 16 16 16 16 16 16 17 17 17 17 17 17 17 17 17 17 17 17 17 18 18 18 18 18 19 19 19 19 19 19 20 20 20 20 20 20 20 20 21 21 21 21 21 22 22 22 22 22 22 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 27 27 28 28 29 29 30 30 31 31 31 31 32 32 32 32 32 32 33 33 36 38 38 39 40 41 41 43 47 50 53 60
3.测得某地300名正常人尿汞值,其频数表如表3-2,试用正态分布法和百分位数法估计该地正常人尿汞值的90%,95%,99%上限,讨论用何法估计较适宜。
表3-2 300例正常人尿汞值(?g/l)频数表
尿汞值 0~ 4~ 8~ 12~ 16~ 20~
例数 49 27 58 50 45 22
尿汞值 24~ 28~ 32~ 36~ 40~ 44~
例数 16 9 9 4 5 -
尿汞值 48~ 52~ 56~ 60~ 64~ 68~72
例数 3 - 2 - - 1
4.某市20岁男学生160人的脉搏数(次/分钟),经正态性检验服从正态分布。求得
X?76.10,S=9.32。试估计脉搏数的95%、99%参考值范围。
5.将测得的238例正常人发汞值(?g/g)从小到大排列,最后14个发汞值如下,求95%
单侧上限。
发汞值:2.6 2.6 2.6 2.6 2.7 2.7 2.7 2.8 2.8 3.0 3.3 4.0 4.1 4.3 秩 次:225 226 227 228 229 230 231 232 233 234 235 236 237 238
五、习题答题要点
(一)单项选择题
1.A 2.C 3. D 4. D 5. A (二)名词解释
1.正态曲线:正态曲线(normal curve)是函数 f(X)?1?2?e?(X??)2(2?2) , ???X???
对应的曲线。此曲线呈钟型,两头低中间高,左右对称。
2.正态分布:若指标X的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布(normal distribution)。通常用记号N(?,?)表示均数为?,标准差为?的正态分布。
2