自考数理统计复习资料之简答题
1.简述二项分布、Poisson分布和正态分布间的联系。 答:二项分布、Poisson分布和正态分布间的联系为:
(1)在n很大,而π很小,且nπ=?为常数时,二项分布的极限分布为Poisson分布; (2)在n较大、π不接近0也不接近1时,二项分布B(n,π)
2近似正态分布N(n?,n?(1??)),而相应的样本率P的分布也近似正态分布N(?,?P)。
(3)当?增大时,Poisson分布渐近正态分布。一般而言,?≥20时,Poisson分布资料可作为正态分布处理。 2、假设检验中?与P的区别何在?
答:?和P均为概率,其中?是指拒绝了实际上成立的H0所犯错误的最大概率,是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的,在H0成立的前提条件下,出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与?对比来得到结论,若P≤?,则拒绝H0,接受H1,有统计学意义,可以认为……不同或不等;否则,若P>?,则不拒绝H0,无统计学意义,还不能可以认为……不同或不等。 3、均数、几何均数、和中位数的适用范围?
均数:适用于对称分布,特别是正态分布资料。
几何均数:适用于成等比级数的资料,特别是对数正态分布资料 中位数:各种分布类型的资料,特别是偏态分布资料和开囗资料 4、均数的可信区间与参考值范围有何不同?
答:均数的可信区间与参考值范围的区别主要体现在含义、计算公式和用途三方面的不同,具体如
下表所示。 区别点 意 义
均数的可信区间
按预先给定的概率所确定的未知参数的可能范围。实际上一但可以说:该可信区间有多大(如当?=0.05时为95%)的可能性包含了总体均数。
参考值范围
“正常人”的解剖、生理、生
次抽样算得的可信区间要么包含了总体均数,要么不包含。化某项指标的波动范围。
计算 公式
?未知:
X?t?/2,?Sn*?已知:
X?u?/2?n**
正态分布:
X?u?/2S**
偏态分布:PX~P100?X
?未知但n>60:
X?u?/2Sn**
用途 估计总体均数 判断观察对象的某项指标正常与否
5、简述回归系数与相关系数的区别与联系。 答:二者的联系:
(1)对于既可作相关又可作回归分析的同一组数据,计算出的b与r正负号一致。 (2)相关系数与回归系数的假设检验等价,即对于同一样本,tb?tr。 (3)同一组数据的相关系数和回归系数可以相互换算:r?bYgX?SX/SY。 (4)用回归解释相关:由于决定系数r2=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明引入相关的效果越好。
二者的区别:
(1)资料要求上:相关要求X、Y服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;回归要求Y在给定某个X值时服从正态分布,X是可以精确测量和严格控制的变量,称为Ⅰ型回归。
(2)应用上:说明两变量间相互关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y如何依赖于X而变化。
(3)意义上:r说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X每变化一个单位所导致Y的平均变化量。
(4)计算上:r?lXY/lXXlYY,b?lXY/lXX。 (5)取值范围:?1?r?1,???b??。 (6)单位:r没有单位,b有单位。 6、为什么假设检验的结论不能绝对化?
答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能
发生两类错误。拒绝H0时,可能犯I型错误;“接受”H0时可能犯II型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。
7、在完全随机设计方差分析中SS组间、SS组内各表示什么含义?
答:SS组间表示组间变异,指各处理组样本均数大小不等,是由处理因素(如果有)和随机误差造成的;SS组内表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。
8、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同? 答:
区 别 点 设计
完全随机设计
采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理。 三种变异:
随机区组设计
随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。 四种变异:
变异分解
SS总?SS组间?SS组内
(SS总?SS处理?SS误差)
SS总?SS处理?SS区组?SS误差
9、试举例说明均数的标准差与标准误的区别与联系。
答:例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X为138.5g/L,标准差S为5.20g/L,标准误SX为1.04g/L。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其算术均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。本例均数的标准误SX?Sn?5.2025?1.04,此式将标准差和标准误从数学上有机地
联系起来了,同时还可以看出:当标准差不变时,通过增加样本含量可以减少标准误。 10、正态分布与标准正态分布联系与区别?
答:二种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布。标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。
11、常用的相对数有哪几种?简述各种相对数指标的含义,计算方法及特点。
答:有强度相对数(率)、结构相对数(构成比)、相对比三种。
率的含义:某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。其特点为:说明某现象发生的强弱。
计算公式:率?某时期内发生某现象的观察单位数?比例基数
同期可能发生某现象的观察单位总数构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100为比例基数,又称为百分比。其特点为:①一组构成比的总和应等于100%,即各个分子的总和等于分母;②各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其他部分数值变化的影响。
计算公式:构成比?某一组成部分的观察单位数?100%
同一事物各组成部分的观察单位总数相对比的含义:是两个有关指标之比,说明两指标间的比例关系。其特点为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。
计算公式:
相对比?甲指标(?100%)
乙指标12、应用相对数时应注意哪些问题? 答:
(1)算相对数时分母应该有足够数量; (2)分析时不能以构成比代替率;
(3)分别将分子和分母合计求合计率或平均率; (4)相对数的比较应该注意其可比性;
(5)样本率或构成比比较时应做假设检验 13、对于四格表资料,如何正确选用检验方法? 答:
(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。 (2)对于两样本率比较的四格表资料,应根据各格的理论值T和总例数n的大小选择
2?n?40T?5不同的?计算公式:① 当且所有的时,用检验的基本公式
22(ad?bc)2n(A?T)22????或四格表资料检验的专用公式??;②
(a?b)(c?d)(a?c)(b?d)T22当n?40 但有1?T?5时,用四格表资料?检验的校正公式?c?2?(A?T?0.5)2T或
2(|ad-bc|-n2)n?c=,或改用四格表资料的Fisher确切概率法;③当n?40,(a+b)(c+d)(a+c)(b+d)2或T?1时,用四格表资料的Fisher确切概率法。
若资料满足两样本率u检验的条件,也可用u检验。
(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时①当(b?c)?40??(b?c)2时,??;②当(b?c)?40时,
b?c22c(b?c?1)2b?c。
14、什么叫做非参数检验?它和参数检验有什么区别?
答:非参数检验对总体分布不作严格假定,不受总体分布的限制,又称任意分布检验,它直接对总体分布(或分布位置)作假设检验。如果总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。
15. I型错误与II型错误有何区别与联系?了解这两类错误有何实际意义?
I型错误是指拒绝了实际上成立的H0所犯的“弃真”错误,其概率大小用?表示。II型错误则是指“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用?表示。当样本含量n确定时,?愈小,?愈大;反之?愈大,?愈小。了解这两类错误的实际意义在于,若在应用中要重点减少?(如一般的假设检验),则取?=0.05;若在应用中要重点减少?(如方差齐性检验,正态性检验或想用一种方法代替另一种方法的检验等),则取?=0.10或0.20甚至更高。