好文档 - 专业文书写作范文服务资料分享网站

医学统计学考题(按章节)第7题【07分】__计量资料的统计描述

天下 分享 时间: 加入收藏 我要投稿 点赞

五、其它30分(3~5道题目,每题6~10分)

提供某一素材,可能要求:

? 选择正确的统计方法并简述理由。 ? 对错误进行分析,并予以纠正。

? 对某些数据、指标的含义作出正确的判断。 ? 正交试验表头设计及结果分析

可能涉及范围:

? 计量资料的统计描述、相对数应用注意事项,秩和检验,随访资料的生存分析,正交试验设计

方差分析。

【06真题、05真题】

三、某市100名正常成人男性血红蛋白值(g/dL)频数分布表如下:(7分) 组段 11.5- 12.0- 12.5- 13.0- 13.5- 14.0- 14.5- 15.0- 15.5- 2 6 7 14 24 12 18 10 3 频数

1. 选用何种指标描述其集中位置和离散程度较好?为什么?

2. 估计该地正常成年男性血红蛋白的正常值范围。 SPSS软件有关分析结果:

16.0- 4

【答案】jszb

1、从SPSS软件分析结果可知:偏度系数Skewness=0.044;峰度系数Kurtosis=-0.320;两个系数都小于1,可认为近似于正态分布。

对于正态分布资料描述其集中位置用算数均数较好,该资料算数均数=14.03; 对于正态分布资料描述其离散程度用标准差 较好,该资料标准差 =1.0282。

2、对于正态分布资料正常值范围估计用正态分布法较好:

因男性血红蛋白过多或过少均为异常,故按双侧估计,取95%界限: 下限:

-1.96S=14.03-1.96×1.0282=12.014(g/dL)

上限:+1.96S=14.03+1.96×1.0282=16.045(g/dL)

因此,该地正常成年男性血红蛋白的正常值范围为(12.014,16.045)g/dL 。

【知识点解析】Jszb

频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段 中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。

【频数表的用途】

1.描述数值变量资料的分布特征 集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。

离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。反映了数据的离散程度或者变异程度。

2.描述数值变量资料的分布类型

正态分布:集中位置居中,左右两侧频数基本对称。常见近似正态分布。 偏态分布:集中位置偏向一侧,频数分布不对称。

正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。 负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。

【集中趋势指标描述】

1.算数均数(均数mean):适用于正态分布或者近似正态分布

总体均数:μ ;样本均数:

2.几何均数(geometric mean,G):适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。此资料的原始数据为正偏态分布,取对数后,对数值为正态分布,所以又称为对数正态分布。

3.中位数(median,M):适用于偏态分布资料,或者分布类型未知,或者有不确定数据时。中位数是指将一组变量值从小到大排列,位次居中的变量值。 (1)直接法:

(2)频数表法:

利用百分位数计算公式进行计算.百分位数(PX)是一种位置指标, 。中位数是一个特定的百分位数,即M= P50 。

百分位数计算公式:

ixPx?Lx?(n?x%??fL)

fx其中参数

第X百分位数所在组段的 Lx:下限 ix :组距 fx:频数 ?fL:小于Lx各组段的累计频数 n:总例数 4.注意事项

1.对于偏态分布资料,中位数不受两端特大值和特小值的影响,只和位置居中的观察值有关。而均数受特大值和特小值的影响,会偏大或者偏小,所以对于偏态分布的资料,均数的代表性差,不适合描述偏态分布的集中趋势。 2.中位数适合于任何分布类型的资料,对于正态分布,理论上中位数等于均数。 1、算术均数:X,μ 2、几何均数:G 3、中位数 :M 适应于 资料分布:对称分布、正态分布 变量是倍数关系、资料分布:呈对数正态分布【含义为指数的平均】 偏态分布、资料分布:一端或两端有未确定值 【离散趋势指标描述】

1.极差或者全距(range,R):表示一组变量值中最大值和最小值之差。适合任何分布类型的资料。 R=最大值-最小值

计算简单,但是不能反映所有变量值的变异程度,易受最大值和最小值的影响,不稳定 2.方差(variance):表示一组变量值的平均离散程度。

方差越大,离散或者变异程度越大。适合描述近似正态分布资料的离散趋势。

3.标准差(standard deviation):是方差的开方,和均数的单位一致,也表示一组变量值的平均离散程 度。适合描述近似正态分布资料的离散趋势

4.四分位数间距(quartile,Q):P75、P25分别表示第75百分位数和第25百分位数。 Q= P75-P25

注:适合描述任何分布类型资料的离散趋势,主要用于偏态分布资料。

5.变异系数(coefficient of variation, CV )用于描述数据的相对离散程度。

CV : 单位不同,均数相差悬殊 S : 单位相同,均数相近 全距(极差) 四分位数间距 R 反映一组同质观察值个体差异的范围。 缺点(1)不能反映组内其它观察值的变异度。 (2)样本含量越大,则全距可能也越大。 QR 即P75-P25 四分位数可看作是一组同质观察值居中的50%变量值的变异范围。 与全距比较有何优点?不受极值影响,较稳定。 应用: (1)偏态分布; (2)资料一端或两端有未确定值。 2 2(?S)和 应用;对称分布;尤其是正态分布 (?、S) CV 应用:比较单位不同的几组资料的变异程度;比较均数相差悬殊的几组资料的变异程度。 方差和标准差 变异系数 【制定参考值范围】

(1)正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。 (2)百分位数法常用于偏态分布的指标。表3-1 中两种方法的单双侧界值都应熟练掌握。

3.质量控制:为了控制实验中的测量(或实验)误差,常以X ± 2S作为上、下警戒值,以X ± 3S 作 为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

skewness偏度系数g1:定量描述分布的偏态;是两个同样单位的比,无量纲; 系数的绝对值描述分布的偏斜程度

g1=0,分布对称; g1>0 分布正偏;g1<0分布负偏

Kurtosis峰度系数g2:描述分布的尖峭程度是两个同样单位的比,无量纲; g2=0 ,正态峰;G2>0尖峭峰;G2<0平阔峰

判断正态分布:偏度系数Skewness;峰度系数Kurtosis;两个系数都小于1,可认为近似于正态分布。

医学统计学考题(按章节)第7题【07分】__计量资料的统计描述

五、其它30分(3~5道题目,每题6~10分)提供某一素材,可能要求:?选择正确的统计方法并简述理由。?对错误进行分析,并予以纠正。?对某些数据、指标的含义作出正确的判断。?正交试验表头设计及结果分析可能涉及范围:?计量资料的统计描述、相对数应用注意事项,秩和检验,随访资料的生存分析,正交
推荐度:
点击下载文档文档为doc格式
855387eazi6j6mw9sjhs44p5c1cp2i00dzw
领取福利

微信扫码领取福利

微信扫码分享