健康管理师考试辅导 流行病学和医学统计学
医学统计学基础知识
基本概念 统计描述 统计图表 统计推断 基本概念
医学统计学的定义和研究对象
1.定义 统计学通常被定义为“关于数据收集、表达和分析的普遍原理和方法”。医学统计学则可定义为“根据统计学的原理和方法,研究医学数据收集、表达和分析的一门应用学科”。
2.研究对象 医学统计学的研究对象是具有不确定性的医学数据,其基本研究方法是通过收集大量资料,通常是人、动物或生物材料的测量值,发现蕴含其中的统计学规律。
医学统计学的主要内容 1.统计设计
包括调查设计和实验设计。调查设计主要有抽样方法、调查技术、质量控制技术等;实验设计主要有各种实验设计模型、分组方法、样本量估计等。
由于统计设计关系到资源分配的可行性、数据收集的正确性和结论的科学性,一旦出现设计上的失误或缺陷,有可能导致在整个研究的失败。因此,统计设计是保证统计描述和推断正确的基础。
2.统计描述 对原始数据归纳整理,用相应的统计指标,如率、均数等,表示出研究对象最鲜明的数量特征,必要时选择统计表或统计图。
3.统计推断 在统计描述的基础上,对统计指标的差别和关联性进行分析和推断。
医学统计资料的类型
在医学研究中,试验或观察结果常按分组因素和反应变量分别记录。分组因素为研究者根据试验目的施加的干预,如不同治疗药物、不同治疗期限等。在某些不能施加干预的观察性研究中,研究者感兴趣的因素,如年龄、性别等,也可看作分组因素。在流行病学研究中,这些因素又称为危险因素。反应变量是指施加干预后的研究对象的生物反应,如是否治愈、是否死亡、红细胞计数、血细胞计数、血压值等。 统计资料类型通常针对反应变量而言,如收缩压、舒张压、药物不良反应等。
1.计量资料 亦称数值变量,为定量测量的结果,通常用专用仪器测量,并有计量单位,如身高(cm)、体重(kg)等。计量资料有连续性的特点,如身高可以是175cm、175.1cm、175.11cm等。
2.计数资料 计数资料是定性观察的结果。有二分类和多分类两种情况。二分类观察结果只有两种相互对立的属性,如“阳性”或“阴性”、“死亡”或“存活”、“正常”或“异常”;多分类的定性观察结果有两种以上互不包含的属性,如新生儿出生缺陷、某病患者的死亡原因等。
这类资料之所以称为计数资料,因为在统计时通常将各种观察结果按属性分类计数,如阳性人数、阴性人数、死于某病人数等。
3.等级资料 介于定量测量和定性观察之间的半定性观察结果,通常有两个以上等级,如阴性、阳性、强阳性,治愈、好转、有效、无效等。
等级资料与计数资料又可统称为分类变量。它们的区别在于,等级资料虽然也是多分类资料,但各个类别间还是存在大小或程度上的差别。 表5-3 108例高血压患者随访记录汇总表
编号 随访方式 收缩压 舒张压 服药依从性 药物不良反应 第1页
健康管理师考试辅导 流行病学和医学统计学
11-00325 11-00326 11-00328 …… 11-00457 门诊 门诊 家庭 …… 电话 146mmHg 130mmHg 128mmHg …… 142mmHg 95mmHg 84mmHg 90mmHg …… 90mmHg 规律 规律 间断 …… 不服药 无 无 有 …… 有
医学统计工作的基本步骤
研究设计、收集资料、整理资料和分析资料是统计工作的4个基本步骤。这4个步骤是紧密联系不可分割的,某一环节发生问题,都将影响最终的统计分析结果。 1.研究设计
按研究者是否对观察对象施加干预(即处理因素),可以分为调查设计和实验设计两大类。调查设计(不加干预)主要是了解客观实际情况的现场工作。实验设计(加干预)根据研究对象不同分为动物实验和临床试验(或现场试验)。
无论是调查设计,还是实验设计均包括专业设计和统计学设计两个方面。专业设计是运用专业理论技术知识进行设计,统计学设计是运用统计学知识和方法进行设计。两者应相互结合,缺一不可。 2.收集资料的任务是取得准确可靠的原始数据。
(1)统计资料的来源:①经常性资料。一般指医疗卫生工作中的原始记录。如医疗卫生工作记录和报告单(卡)、医院各科门诊病历、住院病例、健康检查记录等;②一时性资料。根据专题调查或实验研究的需要而临时设计的调查表或调查问卷,如临床试验的病例报告单、动物实验的数据记录等。
(2)统计资料的要求:原始资料是统计工作的基本依据,把好收集资料这一关,要求做到:①资料必须完整、正确和及时;②要有足够的数量;③注意资料的代表性和可比性。 3.整理资料的任务是整理原始数据,使其系统化、条理化,以便进一步计算指标和分析。
(1)原始数据的检查与核对:检查核对原始数据有无错漏,以及数据间的相互关系是否合乎逻辑,并予以必要的补充、修正与合理的剔除。对原始记录的检查核对,应在调查现场完成,而整理资料过程则是从不同角度、用不同方法进一步浄化数据。
它包括:①统计数据的常规捡查。如检查原始记录的数据有无错误和遗漏;调查项目是否按要求或填表说明填写;统计表格的行栏合计应与总计相符。②数据的取值范围检错。可利用频数分布表检查是否有异常值的出现。③数据间的逻辑关系检错。逻辑检查是为了查明资料项目之间是否有矛盾,例如,乙型肝炎病史与乙型肝炎血清标志物检查结果是否矛盾。
(2)数据的分组设计和归纳汇总:按资料的性质和数量特征分组,以反映事物的特点。例如,整理某药物治疗消化性溃疡后的疗效资料,除了得到总的治愈人数外,还可以按年龄、性别、病情轻重等多种特征进行分组,得出各组的治愈人数和治愈率,才能对药物疗效与疾病有关因素进行分析。
常用的分组方法有以下两类:①质量分组:按事物的性质或类型分组,这种方法多适用于分类变量资料或等级资料。如患者按性别、病情轻重等分组作为分组变量;疗效按治愈、好转和无效等分组作为结局变量。根据研究需要,有时也可将计量资料转换成计数资料或等级资料,进行质量分组。例如,舒张压<90mmHg为正常血压,舒张压>90mmHg为高血压。②数量分组。按观察值的大小进行分组,这种方法多适用
第2页
健康管理师考试辅导 流行病学和医学统计学
于数值变量的资料。分几组合适要根据研究内容的特点和分析目的来定。例如冠心病多发于中、老年人。年龄分组时,应把中、老年组分得细些,如5岁—组;青、少年组分得粗些,如10岁一组。
4.分析资料任务是按研究设计的要求,结合资料的类型计算有关指标,阐明事物的内在联系和规律。主要包括: (1)用一些统计指标、统计图表等方式表达和描述资料的数量特征和分布规律,不涉及由样本推论总体的问题。 (2)对样本统计指标作参数估计和假设检验,并结合专业知识解释分析结果,目的是用样本信息推断总体特征。
统计学的几个重要概念 1.同质与变异
研究对象具有相同的背景、条件、属性称为同质(homogeneity);同一性质的事物,其个体观察值(变量值)之间的差异,在统计学上称为变异(variation)。统计学所研究的对象是以同质为基础,并具有变异的事物或现象。例如,调查1998年所有20岁健康男大学生的身高。它的同质基础是同一地区、同一年份、同为20岁健康男大学生;这些20岁健康男大学生的身高值有的相同,有的不尽相同,存在差异,这种身高值之间的差异就是变异。 2.总体与样本
总体(population)是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。这里的观察单位亦称个体,是统计研究中最基本的单位。有的总体是在确定的同质基础上明确了一定时间、一定空间的有限个观察单位,称为有限总体。有时总体是抽象的,观察单位数是无限的,该总体称无限总体。
医学研究中的很多情况是无限总体,而即使是有限总体,由于总体较大,要收集所有观察单位的数据既费时、费力还容易产生差错,很多时候是不必要和不必须的,所以医学研究的资料多数是通过抽样研究去获得。即从总体中随机抽取有代表性的一部分观察单位,其测量值(或观察值)的集合称为样本(sample)。抽样研究的目的是用样本信息推论总体特征。 3.参数与统计量
参数(parameter)指总体指标,如总体均数、总体率、总体标准差等。
统计量(statistic)指样本指标,如样本均数、样本率、样本标准差等。一般情况下,参数是未知的,需要用统计量去估计。用统计量推论参数的方法,统计学上称为参数估计和参数检验。
4.误差 任何周密设计的科学研究,都不可能没有误差(error)。医学科学研究中的误差通常指测量值与真实值之差,其中包括系统误差和随机测量误差;以及样本指标与总体指标之差,即抽样误差。系统误差应该通过周密的研究设计和调查(或测量)过程中的严格质量控制措施予以解决;随机测量误差及抽样误差都属于随机误差,随机测量误差是不可避免的,但应尽量的小;抽样误差是抽样机遇所致,是客观存在,不可避免的。这种误差可以通过统计方法估计,也可通过增大样本含量使其减小。
5.概率与频率 概率(probability)是对总体而言,频率(frequency)是对样本而言。概率指某随机事件发生的可能性大小的数值,常用符号P来表示。随机事件的概率在0与1之间,即0≤P≤1,常用小数或百分数表示。P越接近1,表明某事件发生的可能性越大,P越接近0,表明某事件发生的可能性越小。频率指一次实验结果计算得到的样本率。统计中的许多结论都是带有概率性的。一般常将P≤0.05或P≤0.01称为小概率事件,表示某事件发生的可能性很小。 【例题】下列资料属等级资料的是 A.白细胞计数(个/L) B.血型(A、B、O、AB) C.体重(kg)
第3页