好文档 - 专业文书写作范文服务资料分享网站

《卫生统计学》课程复习资料

天下 分享 时间: 加入收藏 我要投稿 点赞

实用文档

《卫生统计学》课程复习资料

一、名词解释:

1.计量资料:对每个观察单位用定量的方法测定某项相同,适用于近似正态分布的资料,大样本、小样有差别,按规定的检验水准?所能发现该差异的能力。 指标量的大小,所得的资料称为计量资料。计量资本均可,最为常用。 24.检验水准:是预先规定的,当假设检验结果拒绝H0,料亦称定量资料、测量资料。.其变量值是定量的,13.变异系数:用于观察指标单位不同或均数相差较大接受H1,下“有差别”的结论时犯错误的概率称为表现为数值大小,一般有度量衡单位。 时两组资料变异程度的比较。 检验水准,记为?。 2.计数资料:将观察单位按某种属性或类别分组,所14.正态分布:若资料X的频率曲线对应于数学上的正25.方差分析:就是根据资料的设计类型,即变异的不得的观察单位数称为计数资料。计数资料亦称定性态曲线,则称该资料服从正态分布。通常用记号同来源将全部观察值总的离均差平方和与自由度

2N(?,?)表示均数为?,资料或分类资料。其观察值是定性的,表现为互不标准差为?的正态分布。 分解为两个或多个部分,除随机误差外,其余每个

相容的类别或属性。 15.标准正态分布:均数为0、标准差为1的正态分布被部分的变异可由某个因素的作用(或某几个因素的

23.等级资料:将观察单位按测量结果的某种属性的不称为标准正态分布,通常记为N(0,1)。 交互作用)加以解释。通过各变异来源的均方与误同程度分组,所得各组的观察单位数,称为等级资16.统计推断:通过样本指标来说明总体特征,这种差均方比值的大小,借助F分布作出统计推断,判料。等级资料又称有序变量。 通过样本获取有关总体信息的过程称为统计推断。 断各因素对观测指标有无影响。 4.总体:总体指特定研究对象中所有观察单位的测量17.抽样误差:由个体变异产生的,由于抽样造成的样26.随机区组设计:事先将全部受试对象按自然属性分值。 本统计量与总体参数的差异,称为抽样误差。 为若干区组,原则是各区组内的受试对象的特征相5.样本:从总体中随机抽取部分观察单位,其测量结18.标准误:通常将样本统计量的标准差称为标准误。 同或相近,且受试对象数与处理因素的水平数相果的集合称为样本(sample)。 19.可信区间:按预先给定的概率确定的包含未知总体等。然后再将每个区组内的观察对象随机地分配到6.变异:同质个体间研究因素的差异。 参数的可能范围。 各处理组,这种设计叫做随机区组设计。 7.频数表:用来表示一批数据各观察值在不同取值区20.参数估计:指用样本统计量估计总体参数。参数估27.相对数:是两个有联系的指标之比,是分类变量常间出现的频繁程度(频数)。 计有两种方法:点估计和区间估计。 用的描述性统计指标,常用相对数有率、构成比、8.算术均数:描述一组数据在数量上的平均水平。总21.假设检验中P的含义:指从H0规定的总体随机抽得相对比。 体均数用?表示,样本均数用X表示。 等于及大于(或等于及小于)现有样本获得的检验28.标准化法是常用于内部构成不同的两个或多个总9.中位数:将一组观察值由小到大排列,位次居中的统计量值的概率。 率比较的一种方法。标准化法的基本思想就是选定那个数。 22.Ⅰ型和Ⅱ型错误:Ⅰ型错误指拒绝了实际上成立的一个统一“标准”(标准人口构成比或标准人口数),10.极差:亦称全距,即最大值与最小值之差,用于资H0,这类“弃真”的错误称为Ⅰ型错误,其概率大然后按选定“标准”计算调整率,使之具备可比性料的粗略分析,其计算简便但稳定性较差。 小用?表示;Ⅱ型错误,指接受了实际上不成立的以后再比较,以消除由于内部构成不同对总率比较11.方差:方差表示一组数据的平均离散情况,由离均H0,这类“存伪”的错误称为Ⅱ型错误,其概率大带来的影响。 差的平方和除以样本个数得到。 小用?表示。 12.标准差:是方差的正平方根,使用的量纲与原量纲23.检验效能:1-?称为检验效能,它是指当两总体确

--------------------------------------------------------------------------------------------------------------------------------------------------- 29.构成比(proportion)表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。常以100%为比例基数。计算公式为

实用文档

构成比?某一组成部分的观察单位数?100% (5.2)

同一事物各组成部分的观察单位总数2

2

30.Yates校正:英国统计学家Yates F认为,由于χ分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的χ值不连续,尤其是自由度为1的四格表,求

2

出的概率P值可能偏小,此时需对χ值作连续性校正(correction of continuity),这一校正即所谓的Yates校正(Yates’ correction)。

31.非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。

32.直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。

33.相关系数:又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 34.统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。

35.回归系数b:是直线的斜率(slope),其统计意义是当X变化一个单位时Y的平均改变的估计值。b?0 时直线从左下方走向右上方,Y随X的增大而增大;b?0时直线从左上方走向右下方,Y随X的增大而减小;b?0时直线与X轴平行,Y与X无直线关系。b的计算公式为

b?lXYlXX??(X?X)(Y?Y) 2?(X?X)--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

二、单项选择题:

1.观察单位为研究中的 [个体] 程度。 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两2.总体是由[同质个体组成] 9.血清学滴度资料最常用来表示其平均水平的指标乡居民的钩虫感染率,但甲乡人口女多于男,而乙3.抽样的目的是 [由样本统计量推断总体参数] 是 [几何均数] 乡男多于女,适当的比较方法是[对性别进行标准4.参数是指 [总体的统计指标] 10.两样本均数的比较,可用[两者均可 ] 化后再比较] 5.关于随机抽样,下列哪一项说法是正确的?[抽样 p(1?p)15.率的标准误的计算公式是[]

时应使得总体中的每一个个体都有同等的机会被抽11.配伍组设计的方差分析中,?配伍等于 [?总-?处理n取] -?误差] 16.非参数统计应用条件是 [不依赖于总体分布]

12.在均数为?,标准差为?的正态总体中随机抽样,6.各观察值均加(或减)同一数后[均数改变,标准17.下述哪些不是非参数统计的特点? [检验效能总

差不变] 是低于参数检验]

|X??|?( 1.96?X)的概率为5%。 7.比较身高和体重两组数据变异度大小宜采用 [变18.设配对设计资料的变量值为 X1和X2,则配对资料

异系数] 的秩和检验 [把X1与X2的差数绝对值从小到大编秩] 13.完全随机设计方差分析的检验假设是 [各处理组8.以下指标中(中位数)可用来描述计量资料的离散19.秩和检验和t检验相比,其优点是 [计算简便,不总体均数不全相等]

实用文档

受分布限制]

20.对两样本均数作比较时,已知n1、n2均小于 30,总体方差不齐且分布呈偏态,宜用[秩和检验] 21.等级资料的比较宜用 [秩和检验]

22.两个小样本比较的假设检验,应首先考虑 [资料符合哪种检验的条件]

23.对于配对比较的秩和检验,其检验假设为 [样本的差数应来自均数为0的非正态总体]

24.用最小二乘法确定直线回归方程的原则是各观察点 [距直线的纵向距离的平方和最小]

25.实验设计的三个基本要素是 [处理因素、受试对象、实验效应]

26.实验设计的基本原则 [随机化、重复、设置对照] 27.实验设计和调查设计的根本区别是 [实验设计可人为设置处理因素]

28.标准正态分布的均数与标准差分别为 [0与1] 29.正态分布有两个参数?与?,(?越大)相应的正态曲线的形状越扁平。

30.若X服从以?,?为均数和标准差的正态分布,则X的第95百分位数等于 [??1.64? ]

31.计算某地某年麻疹发病率,其分母为 [该地易感人群人数]

32.两个独立小样本计量资料比较的假设检验,首先应考虑 [资料符合t检验还是Wilcoxon秩和检验条件] 33.若决定系数为 0.04,则下列说法错误的是[散点图中所有的实测点都排列在一条回归线上] 34.老年人口系数下降,可使[粗死亡率下降]

35.标准化以后的总死亡率 [反映了相对水平,仅作

为比较的基础]

36.配对样本差值的Wilcoxon符号秩检验,确定P值的方法为 [T值在界值范围内,P大于相应的?]

37.关于回归系数的描述,下列说法错误的是 [b?0,表示回归直线与y轴交点在原点上方]

38.实验设计和调查设计的根本区别是 [实验设计可人为设置处理因素]

39.少年儿童人口系数下降,可使 [粗死亡率上升] 40.以下对于标准化法的描述错误的是 [标准化率代表真实的死亡(或患病、发病)率水平]

41.多样本计量资料的比较,当分布类型不清时选择 [H 检验]

42.回归系数的假设检验,其无效假设 H0是 [β=0] 43.估计样本含量时,所定第Ⅱ类误差愈小,则 [所要的样本含量愈大 ]

44.欲计算某年新生儿死亡率,则应选用作为分母的是 [某年活产总数]

45.用以说明某现象发生的频率或强度的指标为 [率]

46.当四个样本率比较,得到?>?220.05,3

代入两点描出回归线。下面选项哪项正确? [所绘回归直线必过点(X,Y)]

49.研究A药抗癌效果,将患有某种肿瘤的大白鼠随机分为两组,一组未给药,一组饲服抗癌A药;2周后检测体内存活的肿瘤细胞数。这种对照在实验设计中称为 [空白对照]

50.行×列表中,对于理论频数太小的情形,最好采用 [增大样本容量,以达到增大理论频数的目的 ]

51.直线相关分析中,对相关系数作假设检验,其目的是[推断两变量间是否存在直线相关关系]

52.用最小二乘法确定直线回归方程的原则是 [各观测点距直线的纵向距离平方和最小]

53.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择40例胃炎和胃溃疡病人,随机分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效的“胃苏冲剂”。这种对照在实验设计中称为 [标准对照]

54.某研究欲调查某市中学生对艾滋病的认识,从全市40所中学随机抽取4所,对该4所学校的全部学生实施问卷调查。该种抽样方法属于 [整群抽样]

,则可以认

为[四个总体率不同或不全相同]

47.成组设计两样本比较的秩和检验,其检验统计量T是[以例数较小者秩和为T ]

?=0.004+0.0488X,48.直线回归分析中,有直线回归方程Y------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

三、简答题:

1.对于一组近似正态分布的资料,除样本含量n外,答:三个指标分别说明: 资料的集中趋势; 还可计算X,S和X?1.96S,问各说明什么? (1)X为算术均数,说明正态分布或近似正态分布(2)S为标准差,说明正态分布或近似正态分布资

实用文档

答:频数分布表的用途是: 3.试述正态分布的面积分布规律。 ⑴描述频数分布的类型; 答:正态分布的面积分布规律是: ⑵描述频数分布的特征; (1)X轴与正态曲线所夹面积恒等于1或100%; ⑶便于发现一些特大或特小的可疑值; (2)区间???的面积为68.27%,区间

⑷便于进一步做统计分析和处理。 ??1.96?的面积为95.00%,区间2.说明频数分布表的用途。 ??2.58?的面积为99.00%。

------------------------------------------------------------------------------------------------------------------------------------------------ 4.均数的可信区间与参考值范围有何不同?

答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如下表所示。

区别点 意 义 计算 公式

均数的可信区间

按预先给定的概率所确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该可信区间有多大(如当?=0.05时为95%)的可能性包含了总体均数。

参考值范围

“正常人”的解剖、生理、生化某项指标的波动范围。

料的离散趋势;

(3)X?1.96S可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含总体的95%的个体值。

?未知:X?t?/2,?S*

n正态分布:X?u?/2S

**

偏态分布:PX~P100?X

?已知:X?u?/2?n**

?未知但n>60: X?u?/2用途

* t?/2,?也可用t?,?(对应于单尾概率时)

估计总体均数

S** n判断观察对象的某项指标正常与否

**u?/2也可用u?(对应于单尾概率时)

------------------------------------------------------------------------------------------------------------------------------------------------ 5.假设检验中?和P的区别何在?

答:?和P均为概率,其中?是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设

实用文档

定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与?对比来得到结论,若P≤?,则拒绝H0,接受H1,有统计学意义,可以认为……不同或不等;否则,若P>?,则不拒绝H0,无统计学意义,还不能认为……不同或不等。

6.假设检验时,当P?0.05,则拒绝H0,理论依据是什么? .答:P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t或u)的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下“有差别”的结论的同时,我们能够知道可能犯I型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

7.怎样正确选用单侧检验和双侧检验?

答:单双侧检验首先应根据专业知识来确定,同时也应考虑所要解决问题的目的。若从专业知识判断一

12.对于四格表资料,如何正确选用检验方法? 答:(1)首先应分清是两样本率比较的四格表资料还

是配对设计的四格表资料。

(2)对于两样本率比较的四格表资料,应根据

各格的理论值T和总例数n的大小选择不同的χ

2

计算公式:①当n?40且所有的T?5时,用χ

2

种方法的结果可能低于或高于另一种方法的结果,则用单侧检验。在尚不能从专业知识判断两种结果谁高谁低时,用双侧检验。若研究者对低于或高于两种结果都关心,则用双侧检验;若仅关心其中一种可能,则取单侧检验。一般认为双侧检验较保守和稳妥,单侧检验由于充分利用了另一侧的不可能性,故更易得出有差别的结论,但应慎用。

8.为什么假设检验的结论不能绝对化?

答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。

9.为什么不能以构成比代率?请联系实际加以说明。 答:率和构成比所说明的问题不同,因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率

检验的基本公式?2??(A?T)2T或四格表资料

χ2

检验的专用公式

2(ad?bc)2??n(a?b)(c?d)(a?c)(b?d);②当n?40

最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。

10.方差分析的基本思想和应用条件是什么?

答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。

方差分析的应用条件:①各样本是相互独立的随机样本,均服从正态分布;②相互比较的各样本的总体方差相等,即具有方差齐性。

11.为什么在方差分析的结果为拒绝H0、接受H1之后,对多个样本均数的两两比较要用多重比较的方法? 答:方差分析的备择假设H1是g个总体均数不全相等,拒绝H0,接受H1,只说明g个总体均数总的来说有差别,并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等,则需进行多个样本均数间的多重比较。

但有1?T?5时,用四格表资料χ2

检验的校正公

式?2(A?T?0.5)2c??T或

?2=(|ad-bc|-n22)nc(a+b)(c+d)(a+c)(b+d),或改用四格表

《卫生统计学》课程复习资料

实用文档《卫生统计学》课程复习资料一、名词解释:1.计量资料:对每个观察单位用定量的方法测定某项相同,适用于近似正态分布的资料,大样本、小样有差别,按规定的检验水准?所能发现该差异的能力。指标量的大小,所得的资料称为计量资料。计量资本均可,最为常用。24.检验水准:是预先规定的,当假设检验结果拒绝H0,料亦称定量资料、测量资料。.其变量值是
推荐度:
点击下载文档文档为doc格式
92fpg4u2nx7u3cm9b9nu86wqu5roq7003bz
领取福利

微信扫码领取福利

微信扫码分享