一、名词解释(考10对) 1.总体;样本
总体:根据研究目的确定的、同质的全部观察单位某一指标(或某些因素及结果)的测量值总体。根据总体集合所包括元素是否有限,分为有限与无限总体。总体具有特定的分布特征及参数;
样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能够代表总体分布特征的一部分观察单位某指标数据的集合。
根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数。
2.标准差;标准误
标准差:是描述单个测量值对其均数的离散程度。标准差越大,数据的离散程度就越大,均数的代表性越差;标准差越小,均数的代表性越好。
标准误:样本统计量的标准差称为标准误,它反映样本统计量的抽样误差的大小,也反映样本统计量对总体参数的离散程度。标准误大,表示样本统计量对总体参数的代表性差;标准误小,则表示样本统计量对总体参数的代表性好。 比较内容 意义 标准差 描述单个原始观测值与均数的平均离散程度。越小表示离散程度越小,均数代表性好 变量值的标准差为 标准误 描述样本均数间以及样本统计量对总体参数的离散程度。说明抽样误差大小,越小表示样本统计量对总体参数的代表性越好 样本均数的标准误 计算方法 S= (x-x)? 2n-1Sx=S n阳性结果的标准差为 S=np(1-p)样本阳性率的标准误为 Sp=小 p(1?p) n数值大小 用途 大 用于描述观测值的变异范围 制定正常参考值范围;计算cv 用于推断总体参数的可信区间和假设检验 3、x?1.96s;x?t?/2(v)?sx
x?1.96s:表示从正态总体中抽样,样本含量较大时,观测值双侧95%的波动范围 x?t?/2(v)?sx:从正态总体中抽样,样本含量较大(小)时,按照预先给定的概率a确定的总体均值的(1—a)的可信区间。
4.计量资料(数值变量资料);计数资料(分类变量资料) 计量资料:通过度量的方法,测量每个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量单位或多为连续性资料。 计数资料:指将全体观察单位按某种属性分组,然后再分别清点各组观察单位的个数而得
到的数据资料,其特点是没有度量单位或多为非连续性资料 5.点估计;区间估计
点估计:直接利用样本统计量的一个数值来估计总体参数,比如基于一份随机样本,用x估计u,用p估计?,用S估计?。点估计方法简单,但未考虑抽样误差,故难以反映估计值对其真值的代表性。
区间估计:将样本统计量和标准误结合起来,按预先给定的概率(1—a)所确定的一个包含未知总体参数的范围,该范围为总体参数的置信区间(CI)。预先给定的概率(1—a)称为可信度或置信度,常取95%或99%。
6.回顾性研究;前瞻性研究
回顾性研究:即病例—对照研究,是由果到因,即先选定病例组和对照组,然后分别回顾两组过去的暴露情况,比较其差异,探索与发病相关的可能因素。回顾性研究的优点是对于患病率非常低的研究人群可获得较高的效果,研究周期较短和可以探索多个因素与患病的关联;其缺点是不能估计患病率和死亡率,容易产生回忆性偏倚和选择性偏倚。
前瞻性研究:即队列研究,是由因寻果,是将选定的人群按暴露状况分成暴露组和对照组,暴露组接触某个因素而对照组不接触某个因素,其他所有条件两组基本相同。经过一定时间随访,比较暴露组和对照组在随访期间的发病率,如果两组发病率不同,则归因于该暴露因素。前瞻性研究的优点是可以估计发病率,暴露测量可以做到无偏倚,结论比较可靠。其缺点是研究效率比较低,研究周期比较长导致在研究期间可能出现失访及各种混杂因素影响。
7、完全随机设计;随机区组设计
完全随机设计:又称为单因素设计或成组设计,是将同质的研究对象随机地分配到各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。
随机区组设计:又称配伍组设计,是在实验设计中用一个非研究因素的变量进行分层,每个层的观察对象数相等,并对每个层进行随机分组。
两种实验设计方案均为单因素实验设计。区别是:①两者观察对象随机分配方式不同;②统计分析方法不同;③误差内涵及大小不同;④检验效能不同。
8.独立性数据与重复性数据
独立性:对一群观察指标独立测定一次,形成一个群体数据,观察值间互相独立,不相互影响。
重复性:一个观察对象,同一或不同时间测定产生的数据。
9.α值;P值
α值:检验水准(显著性水准),即在假设检验中预先规定的判断小概率事件的概率尺度,通常为0.01或0.05,代表在原假设成立的前提下,拒接原假设所犯I类错误的概率。
P值:从已知总体中(或假设总体中)抽得统计量达到当前统计量这么大及比这绝对值还大的总概率,若以当前统计量为拒绝域临界点,在规定α前提下,实际欲拒绝H0可能犯I
类错误的概率。P27
10.观察性研究;实验性研究
观察性研究:是指对研究对象不加任何干预措施,在完全“自然状态”下观察、记录各研究对象的特征,描述现象的本质,比较不同环境条件下疾病的发生、发展。 观察性研究可以在相应的人群中随机抽样,但不能随机分组,只能按不同的暴露水平分组。与实验性研究相比,调查中涉及的混杂因素较多,所需样本量较大,资料必须做多因素分析。
实验性研究:是指对研究对象人为施加干预的研究。在干预前,研究对象来自同一总体,研究者通过随机分组,对不同处理组的研究对象施加不同的干预,从而比较不同干预措施结果间的差异。 两者的区别为:①处理因素能否由研究者主动设置;②对象能否随机分组;③样本大小不同;④混杂因素多少不同;⑤统计方法应用不同;⑥严谨性,重、再现性不同。
11、r;b
r:直线相关系数,描述样本资料的两变量之间线性相关性并判断其密切程度。相关系数r没有单位,在-1~+1范围内变动,相关系数的绝对值越接近1,两个变量的线性相关程度越强;相关系数的绝对值越接近0,两个变量的线性相关程度越弱。相关系数若为正,说明一变量随另一变量增减而增减,方向相同,为正相关;若为负,表示一变量增加、另一变量减少,即方向相反,为负相关;若为零,两变量间没有任何伴随变化趋势,为不相关或零相关。 b:直线回归系数,为回归直线的斜率,也即总体回归系数?的估计值。其统计学意义为X每改变一个单位,Y平均改变b个单位。
两者相同点为:①均为数量协同变化研究;②同一资料,两者方向一致;③同一资料,两者假设检验一致;④均有一定的线性范围;⑤bxy?byx?r2
两者不同点为:①含义不同:r表示服从双变量正态分布的两个变量间的数量协同变化的密切程度,b表示变量Y随变量X呈现出的线性依存关系;②两者表达式不同;③两者应用范围不同:直线相关应用于流行病学、探索性实验研究;直线回归应用于实验室工作曲线研究。
12、灵敏度;特异度 灵敏度:表示实际患病按检测结果正确判为有病的概率。灵敏度反映诊断方法正确诊断某病的能力,灵敏度越高,诊断为假阴性的概率越小,即漏诊的可能性越小。
特异度:表示实际未患病按检测结果正确判为没病的概率。特异度反映诊断方法正确排除某病的能力,其值越大,诊断为假阳性的概率越小,即误诊的可能性越小。
13、精密度;准确度
精密度:表示用同种测试方法重复测定同一样品,其测定结果的一致性。可用标准差或变异系数描述。
准确度:表示用某种测试方法测定某一样品,其测定值对真值的偏离程度,一般可用回收率表示。
14、关联性分析;趋势性分析
关联性分析:是研究具有相互作用(对称关系)或单向作用(不对称关系)的两变量取