医学统计学简答题 第二章 定量数据的统计描述
1.变异系数与标准差的区别
标准差使用的度量衡单位与原始数据相同,在两组数据均数相差不大,单位也相同时,从标准差的大小就可以直接比较两样本的变异程度。但是有时我们需要对均数相差较大或单位不同的几组观测值的变异程度进行比较,标准差不再适宜,这时就应该使用变异系数了。
2.集中趋势和离散趋势的指标及适用范围
(1) 集中趋势:算术均数、几何均数、中位数,统称平均数,均反映集中趋势。 算术均数:主要适用于对称分布,尤其适合正态分布资料。 几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。在医院中主要用于抗原(体)滴度资料。
中位数:适合条件:a.极偏态资料。 b.有不确定的数据(有>或<)。 c.有特大值或特小值。 d.分布不明的资料。
(2) 离散趋势:极差、四分位数间距、方差和标准差、变异系数均反映离散趋势 极差:除了两端有不确定数据之外,均可计算极差。 四分位间距:用于描述偏态分布资料。
方差和标准差:用于描述正态分布计量资料的离散程度。 变异系数:a.均数相差较大。 b.单位不同。
3.简述变异系数的实用时机
变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
4.怎样正确描述一组计量资料 (1) 根据分布类型选择指标
(2) 正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选
用中位数与四分位数间距。
5.标准差与标准误的联系和区别有哪些? 区别:(1)概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,标准误越小,均数的可靠性越高。 (2)用途不同:标准差与均数结合估计参考值范围。 (3)计算含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:标准差、标准误均为变异指标,当样本含量不变是,标准误与标准差成正比。
6.正态分布的主要特征
(1)正态曲线在横轴上方均数处最高,即频数最大
(2)正态分布以均数为中心,左右对称,无限接近于x轴
(3)曲线与横轴所围面积为1。正态曲线下面积分布有一定规律
第十章 非参数检验
1.请指出非参数检验与参数检验相比的优、缺点。
答:非参数检验适用范围广,收集资料,统计分析也比较方便,但检验效率没有参数检验高,犯第二类错误的概率较大。
1
2.简述参数检验与非参数检验的定义及两者的区别。
答:参数统计是总体的分布类型是已知的,对其中某些未知的参数进行估计和检验的统计方法。特点:依赖于特定的分布类型,比较的是参数。非参数统计是不依赖于总体分布具体形式的统计方法。特点:不受总体参数的影响,比较的是分布或分布位置,而不是参数。
3.简述配对比较秩和检验的编秩方法。
答:求差值,按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号,差值0删去,相同值取平均秩。
4.配对设计差值的符号秩和检验步骤。 (1)求差值 ; (2)检验假设 ;
(3)编秩:按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号; (4)求秩和并确定统计量T ; (5)统计量:T=min(T+,T-);
(6)确定P值和作出推断结论:查表法,正态近似法。
5.两组比较的秩和检验的编秩方法。
答:将两样本混合编秩次,若有“相同数据”,处于不同组,便取平均秩次;处于同一组,不必取平均秩次。
6.对同一资料,又出自同一研究目的,用参数检验和非参数检验结果不一致时,宜以何为准? 答:当资料满足参数检验方法的条件时,应使用参数检验方法;当资料不满足参数检验方法的条件时,必须采用非参数检验方法。
7.非参数检验的适用范围。
(1) 样本来自的总体分布形式未知;
(2) 不能或未加精确测量的资料,如等级资料; (3)某些分组数据一端或两端是不确定值的;
(4) 参数检验条件得不到满足的,如非正态资料、样本例数较少分布类型显示不清的资料、不能进行数据转换的资料。
第十一章 线性回归与相关
1.两个变量之间的相关系数等于0,是否说明这两个变量之间没有关系? 答:0相关不等于无关,因为可能无直线关系但有曲线关系。
2.直线回归及其回归方程有何用途? (1)描述Y对X的依存关系
(2)预测:由自变量X估算因变量Y。Y波动范围可按求个体Y值容许区间方法计算。
(3)统计控制:控制Y估算X,逆估计。通过控制自变量X的取值,满足因变量Y在一定范围内的波动。
3.简述作直线相关与回归分析时应注意的事项。 (1)回归方程要有实际意义。
(2)分析前绘制散点图,考察是否有直线趋势或异常点。
(3)直线回归的适用范围一般以自变量的取值范围为限,没有充分理由X的取值不要外延。
2
4.线性回归与相关的区别与联系 区别:
(1)相关要求X与Y为随机变量,且X和Y服从双变量正态分布。
(2)回归要求Y为随机变量,服从正态分布;X可人为取值,此时称Ⅰ型回归。若X与Y为随机变量,称Ⅱ型回归。 (3)线性相关表示两个变量之间的相关关系是双向的;线性回归则反映两个变量的关系是单向的,更适合分析因果关系的数量变化。 联系:
(1)同一组资料,r与b正负号一致。 (2)同一样本,tr =tb 。
(3)回归与相关可以互相解释。
5.简述直线相关系数意义。
答:相关系数描述线性相关的密切程度与相关方向。相关系数没有单位,-1≤r≤1,r>0表示正相关,r<0表示负相关,r绝对值等于1表示完全相关,r=0表示无相关,即无直线关系。相关系数的绝对值愈接近1,相关愈密切;相关系数愈接近0,相关愈不密切。
6.经检验认为回归方程有意义,表明两变量间存在因果关系,对否? 答:不一定,应联系专业知识考察变量间关系。
7.用什么方法考察回归直线图示是否正确?
答:直线经过(X,Y)点。直线与纵轴交点的纵坐标为截距a。直线应在自变量X的实测范围内。
第十五章 实验设计与临床试验设计
1.某医院拟研究某新药治疗高血压的疗效,试确定研究设计中的三个基本要素是什么?
答:降压药物为处理因素,高血压患者为受试对象,血压(如舒张压)的改变量为实验效应。
2.样本含量估计的要素有哪些? (1)根据研究目的,建立检验假设 (2)定出检验水准,常取0.05 (3)提出所期望的检验效能
(4)必须知道由样本推断总体的一些信息,例如,对于两总体均数的比较,需知道两均数间的差值和总体标准差。
3.实验设计应当遵循哪些基本的原则? 答:对照原则、随机化原则、重复原则。
4.各举一个配对设计和成组设计的例子。
在评价某降压药物的降压作用时,可以采用以下两种方案。
配对设计:按体重和舒张压相近、性别和窝别相同将40只大鼠分为20对,每对中随机地抽取其一接受A药,另一只接受B药。服用一个疗程后,比较两组血压改变量的区别,从而考察药物A和B的疗效。
成组设计:将体重和舒张压相近、性别相同的40只大鼠随机地分为两组,取其中一组接受A药,另一组接受B药,服用一个疗程后,比较两组血压改变量的平均水平的区别,从而考察药物A和B的疗效。
3
5.按实验设计额要求和原则,对下列设计加以分析:某医师研究一种新药对慢性支气管炎的近期疗效,以门诊30名病人作为观察对象,以30名住院病人服用传统药物作为对照,经过3周治疗后,统计结果发现新药症状进控率高于传统药物进控率。
答:门诊病人与住院病人的病情轻重不均衡。假设门诊病人的病情较轻,则进控率较高可能是由于此原因,从而夸大的新药的作用。建议门诊病人中随机抽取一半接受新药,另一半接受传统药物。住院病人也随机分为两组接受这两种处理,然后分别考察两种药物对不同组别的疗效。
6.某研究者欲将15只大白鼠随机分配到甲、乙、丙三组,每组5例。试由查出的随机数字写出分组结果,并简述分组方法。
答:动物号:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15 随机数字:4、0、9、10、14、5、1、6、2、12、6、11、13、7、8
随机数字对应为0~4,5~9,10~14的个体分别分入甲、乙、丙三组,结果动物号1、2、7、9、11者分入甲组;动物号3、6、8、14、15者分入乙组;动物号4、5、10、12、13者分入丙组。
7.调查研究的基本抽样方法有哪些?按抽样误差由大到小的顺序写出。 答:整体抽样、单纯随机抽样、系统抽样和分层抽样。
8.举例说明开放式问题和封闭式问题的特点。
开放式问题未加任何限制,封闭式问题则提供了若干备选项。
例如在调查首次妊娠年龄时,可以采用开放式问题:请填写您首次妊娠的具体年龄;也可以来用封闭式问题:您首次妊娠的年龄是:①<20岁 ②<25岁 ③<30岁 ④30岁及以上
9.常用的获得原始资料的调查方式有哪些?应答率最低和所得资料最为可靠的方式分别是哪种? 答:直接观察法、直接采访法和间接采访法。
应答率最低的方法是间接采访法,而直接观察法所得资料最为可靠。
10.简述常用的四种随机抽样方法。
(1)完全随机抽样,即总体中每一个体有同等的机会被抽中或分配到某一组,如抽签或随机数字表法;
(2)系统抽样或等距抽样或机械抽样,首先将总体中的个体按某种顺序编码并分为n个组段,间隔为k,接着用完全随机方法在第一组段中抽出一个号码,往后各组依次加k个号码的个体被抽中; (3)整群抽样,首先将总体分为k群,而后从中抽取k个群体作为样本;
(4)分层随机抽样,首先将总体按个体特征分为k层,而后分别从每一层中随机抽样。
4