1、变异:同质事物之间得差别。
2、频数分布得两个特征:集中位置,离散趋势
3、数据分布得类型:对称分布与非对称分布。非对称分布又称偏态分布,包括正偏态与负偏态。单峰分布,双峰分布,多峰分布。
4、统计描述:用统计表、统计图与统计指标等方法对资料得数量特征与分布规律进行描述。 5、集中位置得描述,集中位置指标又称平均数指标。有哪些及适用条件?
(1)算数平均数:最适用于单峰对称分布资料得平均水平得描述,特别就是正态分布资料 (2)几何平均数:适用于①等比资料 ②对数正态分布资料
(3)中位数与百分位数:适用于①偏态分布得资料 ②开口资料 ③资料分布不明等 6、离散趋势得描述
(1)全距亦称极差,适用于单峰小样本资料 (2)四分位数间距,适用于单峰小样本资料
(3)方差与标准差,适用于对称分布尤其就是正态分布资料
(4)变异系数,常用于①比较度量衡单位不同得两组或多种资料得变异度 ②比较均数相差悬殊得两组或多组资料得变异度
7、常用相对数(1)率,就是二分类指标(2)构成比(3)比 8、正确应用相对数应注意几个问题: (1)计算相对数得分母不宜过小 (2)分析时不能以构成比代替率
(3)对观察单位数不等得几个率,不能直接相加求其总率
(4)计算率时要注意资料得同质性,对比分析时应注意资料得可比性
(5)也有抽样误差,需要假设检验。 9、率得标准法
(1)基本思想:采用统一得标准,以消除病情构成不同对治愈率比较得影响,使算得得标准化治愈率有可比性。
(2)目得:控制混杂因素对研究结果得影响。 10、正态分布 (1)概念P16
(2)标准正态分布,u变换:u=,u就是标准正态离差,μ就是均数,σ就是标准差。 u~N(0,1) (3)正态分布得特征:
①就是单峰分布,高峰位置在均数X=μ处。 ②以均数为中心,左右完全对称。
③取决于两个参数,均数μ与标准差σ。μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。σ为形态参数,表示数据得离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。
④有些指标不服从正态分布,但通过适当得变换后服从正态分布,如对数正态分布。 ⑤正态分布曲线下得面积就是有规律得:总面积恒定为1,对称区域面积相等,对应区域面积相等。
(4)几个u界值:①90%:双侧=单侧=1、64 ②95%:双侧=单侧=1、96 ③99%:双侧=单侧=2、58 11、二项分布
(1)样本率得标准差得估计值计算公式:=,p就是样本率 (2)样本个数n与概率π如何影响二项分布得图形?
给定n后,形状取决于π。当π=0、5时,分布对称;当π<0、5时分布呈正偏态;当π>0、5时分布呈负偏态。随n得增大,分布逐渐逼近正态分布。如果nπ或n(1-π)大于5时,则可用正态近似原理处理二项分布得相关问题。 (3)应用条件:对立性,重复性,独立性。 12、Poisson分布
(1)概念,描述罕见事件发生次数得概率分布,就是特殊得二项分布。 (2)均数与方差相等,均为λ。
(3)形状取决于λ得大小,为正偏态分布,λ越小分布越偏;随着λ得增大,分布逐渐趋于对称,当λ=20时,已基本接近对称分布;当λ≥50时,可按正态分布原理处理Poisson分布得有关问题。
(4)Poisson分布具有可加性。
(5)应用条件:对立性,重复性,独立性。即事件得发生就是相互独立得,且发生得概率不变,结果就是二分类得(发生或不发生) 13、参考值范围
(1)概念:绝大多数正常人某指标得波动范围。 (2)正态分布法计算100(1—α)% 正常值范围:双侧 S
单侧 —S(高侧) +S(低侧) 注意α取值:双侧95% 1、96S 单侧95% 高侧<—1、64S
低侧>+1、64S (3)百分位数法:知道求得第几个百分位数P26 14、抽样误差
(1)概念:由于个体变异得存在,由抽样引起得样本统计量与总体参数间得差异。 (2)产生得两个必备条件:①抽样研究 ②个体变异,就是根本原因 (3)中心极限定理得涵义
①从均数为μ、标准差为σ得正态总体中独立、重复、随机抽取含量为n得样本,样本均数得分布仍为正态分布,其均数为μ,标准差为。X~N(μ,)→X~N(μ,)
②即使从非正态总体(均数为μ、标准差为σ)中独立、重复、随机抽取含量为n得样本,只要样本含量足够大(如n≥50),样本均数也近似服从均数为μ,标准差为得正态分布。 (4)标准误意义:1、用来衡量抽样误差得大小
2、= 标准误与个体变异σ成正比,与样本含量n得平方根成反比 (5)标准误得估计值得计算公式:样本标准差s代替总体标准差σ,= (6)标准差与标准误得关系
区别意义用途与异 范围于稳定、标准差个体变正常值n,s误差、信区间得抽样数得可标准误统计量总体均趋于s 96s) (1 (196) n,系 误;
联系:①两者都就是变异指标,说明个体之间得变异用标准差,说明统计量之间得变异用标准
②当样本量不足时,标准差大,标准误也大,均数得标准差与标准误成正比。=
15.医学统计学:运用概率论与数理统计等数学得原理与方法,研究医学领域中资料得搜集、整
n关趋 理、分析与推断得一门学科。
16.三类资料:①定量资料(数值资料)②定性资料(无序分类资料)③等级资料(有序分类资料)
17.总体:按研究目得所确定得研究对象中,所有观察单位某项指标取值得集合。 18.样本:从研究总体中,随机抽取具有代表性得部分观察单位某项指标取值得集合。 19.同质性:具有相同性质得事物。 20.参数:描述某总体特征得指标。 21.统计量:描述某样本特征得指标。
22.概率:随机事件发生可能性大小得一个度量,取值范围为0≤P≤1 23.小概率事件:发生概率≤0、05得事件。
24.小概率原理:小概率事件发生得可能性很小,进而认为其在一次抽样中不可能发生。 25.理解与解释可信区间
26.统计推断:根据样本所提供得信息,以一定得概率推断总体得性质。包括两方面得内容:参数估计与检验假设。
27.可信区间得两个要素:可靠性,精确性
28.均数得可信区间:从正态分布总体N(μ,)中随机抽取一个样本,则t=服从自由度ν=n-1得t分布。总体均数得(1-α)可信区间定义为(—,+)。如n>100,可用标准正态分布代替t分布,相应得100(1-α)%可信区间为(—,+)。 29.率得可信区间:
(1)率得标准差又称率得标准误,为=
(2)总体率π得区间估计用正态近似法得条件:样本含量n足够大,且样本率p与(1-p)都不太小时,如np与n(1-p)均大于5时,π得可信区间为(p—,p+)。