1. 统计设计的基本原则有哪些? (1) (2) (3) (4)
对照:以排除偶然的非处理因素的干扰,如成组对照、配对对照。
随机:总体中每一个体都有同等的机会被抽中,其目的是使样品有代表性,如抽签、随机数字表等。 均衡:处理组与对照组的内部构成一致,如性别一致、年龄一致等。
重复(样本含量):样本一般要求仝30例。
2. 怎样的数据资料属分类资料?数据不代表数值大小,只是一种编码,每个编码代表一种属性,这种资料叫 分类资料,又称分类变量或定性资料。其观察值是定性的,表现为互不相容的类别或属性。 有无序分类、有序分类两种情况。
3. 简述什么叫总体和样本,医学研究中的样本有什么要求?总体:是指根据研究目的确定的同质观察单位的 全体,是同质的所有观察单位某中观察值(变量值)的集合。
样木:用随机方法从总体中抽出的、有代表性的部分观察单位的某变量值的集合。医学研究中的样本应按随机 化原则获取,即总体中每一个观察单位都有同等的机会被选入到样木中来,以避免误差和偏倚对研究结果有 所影响。
4. 统计描述的基本方法有哪些,各自有何特点?
(1 )频数表与频数图:由组段和频数两栏组成的整理表即频数表,将频数表数据在直角坐标系上绘制成图即 频数图。
特点:①?较具体、直观的描述一组数据的特征;②便于发现可疑的异常值;③有助于正确选用统计指标和便 于计算。
(2) 描述性统计量可以用来定量的刻画统计分布的特征,常用的有三类:描述集中趋势的有算术均数,几何 均数,中位数。描述离散趋势的有极差,四分位数间距,方差,标准差,变异系数,描述分布类型的偏度系数 峰度系数。
(3) 百分位数是一种位置参数既可用干描述离散趋势又可描述集中趋势可用于各种连续型 分布。
5. 统计描述的意义是什么?试举例说明。
统计描述,是指用适当的统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描 述,其目的是用直观、简单的形式揭示大量数据所蕴涵的内在信息。例如随机抽取某市六十名十二岁男孩测身 高而对这六十个不同的数据,无论多认真审视也无法说清这些男孩的身高情况,这就要用统计描述来解决这 些问题,对数据进行整理归纳总结分析制作频数表图这样就能具体直观的描述这些数据的特征如有三组同龄 男孩体重如下,其平均体重是30千克,由表而看这三组资料的均数相等,即集中趋势相同,但各组的数据 参差不齐,也就是离散趋势不同,描述这组同质数值变量数据离散程度就用全距、四分位数间距、方差、标 准差等 6. 描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?描述计量资料集中趋势的指标有: 算术平均数、几何平均数、中位数。
(1) 算术均数描述一组同质计量资料的平均水平,适用于对称分布,特别是正态分布近似正态分布的数值变 量数据。
(2) 几何均数,适用于呈正偏态分布,但数据经对数变换后成正态分布的资料。 (3)
顺序排列后位次居中的观察值,
中位数是将一组观察值按大小 适用于各种分布的资料。
7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况?描述计量资料离散程度的指标有: 极差、四分位间距、方差、标准差、变异系数。
(1) 极差是全部观察值中最大值与最小值之差,一般用于描述偏态小样本数据的变异程度。
(2) 四分位数间距是去除两端各四分之一数据后中间一半观察值的变动范围,适用于偏态分布特别是末端没 有具体数据的资料。
(3) 方差、标准差适用于正态分布、近似正态分布对称分布的数据资料。
(4) 变异系数是标准差与均数之比,常用于比较度量单位不同或均数相差悬殊的两组资料的变异度。 8. 怎样正确描述一组计量资料?
首先,制作频数表和频数图,以考察数据分布的形状和对称性等,再根据数据分布的类型选择合适的指 标,以反映数据分布的平均水平。
正态分布资料选用均数与标准差。如儿童身高,可计算均数。均数即观察值的总和除以n,它反映正态 分布资料的平均水平。
对数正态分布资料选用几何均数。如血清抗体滴度,可计算几何均数。几何均数即观察值的乘积开n次 方,它反映对数正态分布的平均水平。
偏态分布资料选用中位数与四分位数间距。如潜伏期天数,可计算中位数。将观察值从小到大排队,位 于正中位置的观察值称为中位数,它反映偏态分布的平均水平。
9. 举例说明抽样误差指什么?由抽样引起的,样本指标与总体指数之间的差别称为抽样误差。
例如从广州市随机抽取60名5岁男孩,测量其身高,这60名男孩的平均身高通常不会恰好 等于全广州市 5岁男孩的平均身高,两者的差别称为抽样误差。 10. 简述假设检验的基本步骤。
答:0.05时拒绝HO,接受H1,反之不拒绝H0,当接受H1时,必须说明其实际意义。 建立假设检验,确定检验水准( 统计推断结论。或者:
2)选定检验方法,计算检验统计量(
3)确定P值,作出
(1)
(1).建立无效假设,其意义为在“无效假设”下,将误差视为随机误差,
5岁男孩平均身高的比较可作
服从某种分布(2) ?根据变量的分布选择和计算统计量,如两组 t检验(3) ?确定P值并作出推论 11.
假设检验中的第一类错误 (a)和第二类错误(b)各指什么?
Ho或不拒绝Ho)
第一类错误(a):假设检验时,根据样本统计量作出的推断结论(拒绝 并不是百分之百的正确,拒绝了实际上成立的
Ho,这类弃真”的错误称为第一类错误。
Ho或不拒绝Ho)
第二类错误(B):假设检验时,根据样本统计量作出的推断结论(拒绝 并不是百分之百的正确,不拒绝实际上不成立的 客观实际 Ho成立
拒绝Ho i型错误(a
不拒绝Ho 推断正确(1-a
Ho,这类存伪”的错误为第二类错误。
Ho不成立 推断正确(1-3) II型错误(3) 或:答I型错误又称第一类错误 (type I error):拒绝了实际上成立的
,为弃真”的错误,
其概率通常用a表示。 可取单尾也可取双尾,假设检验时研究者可以根据需要确定 小,一般规a值大 定曰0.05或心0.01,其意义为:假设检验中如果拒绝时,发生I型错误的概率为5%或1%,即 100次拒绝的结论中,平均有5次或1次是错误的。
n型错误又称第二类错误(type n error):不拒绝实际上不成立的
,为存伪”的错误,其
概率通常用3表示。只取单尾,假设检验时3值一般不知道,在一定情况下可以测算岀,如已知两总体的差 值、样本含量和检验水准。
12. 假设检验的功效指什么,影响功效的因素及其作用有哪些?假设检验的功效是指假设检验中真实差异不被 错判为无差别的概率,
实差异的能力大小。其公式为:Power=1-?
影响因素:①客观差异越大,功效越大。②个体标准差越小,功效越大。③样木量越大,功效越大。④检验标
即某项假设检验发现真
准a值越大,功效越大。
13. 举例说明多个样本均数比较方差分析的统计逻辑是什么?以染尘后三个时期的大鼠全肺湿重数据为例, 比较三个时期的大鼠全肺湿重有无差别。