《生物统计学》复习题
一、填空题(每空1分,共10分)
1.变量之间的相关关系主要有两大类:( 因果关系),(平行关系 )
2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数 )、(调和平均数)
S?3.样本标准差的计算公式(
?(X?X)n?12 )
4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生 )
5.在标准正态分布中,P(-1≤u≤1)=(0。6826 ) (已知随机变量1的临界值为0.1587)
6.在分析变量之间的关系时,一个变量X确定,Y是随着X变化而变化,两变量呈因果关系,则X称为(自变量),Y称为(依变量)
二、单项选择题(每小题1分,共20分) 1、下列数值属于参数的是: A、总体平均数
B、自变量
C、依变量
D、样本平均数
2、 下面一组数据中属于计量资料的是 A、产品合格数
B、抽样的样品数
C、病人的治愈数
D、产品的合格率
3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A、12
B、10
C、8
D、2
4、变异系数是衡量样本资料 程度的一个统计量。 A、变异
B、同一
C、集中
D、分布
5、方差分析适合于, 数据资料的均数假设检验。 A、两组以上
B、两组
C、一组
D、任何
6、在t 检验时,如果t = t0、01 ,此差异是: A、显著水平
B、极显著水平
C、无显著差异
D、没法判断
7、 生物统计中t检验常用来检验 A、两均数差异比较
B、两个数差异比较
C、两总体差异比较
D、多组数据差异比较
8、平均数是反映数据资料 性的代表值。 A、变异性
B、集中性
C、差异性
D、独立性
9、在假设检验中,是以 为前提。 A、 肯定假设
B、备择假设
C、 原假设
D、有效假设
10、抽取样本的基本首要原则是
A、统一性原则 B、随机性原则 C、完全性原则 D、重复性原则
11、统计学研究的事件属于 事件。 A、不可能事件
B、必然事件
C、小概率事件
D、随机事件
12、下列属于大样本的是 A、40
B、30
C、20
D、10
13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A、0.11
B、8.64
C、2.88
D、0.32
14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A、正比关系
B、反比关系
C、加减关系
D、没有关系
15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A、18
B、12
C、10
D、5
16、已知数据资料有10对数据,并呈现线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A、9、1和8
B、1、8和9
C、8、1和9
D、 9、8和1
17、 观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为 A、偶然误差
B、系统误差
C、疏失误差
D、统计误差
18、下列那种措施是减少统计误差的主要方法。 A、提高准确度
B、提高精确度
C、减少样本容量
D、增加样本容量 D、F检验和X2-检验
19、相关系数显著性检验常用的方法是 A、t-检验和u-检验
B、t-检验和X2-检验 C、t-检验和F检验
C、X2-检验
20、判断整体中计数资料多种情况差异是否显著的统计方法是 A、t-检验
B、F-检验
D、u-检验
三、名词解释(每小题5分,共25分)
1、样本:在实际工作中,研究总体时抽出的若干个体组成的单元称为样本。 2、随机抽样: 总体中每个个体均有相等的机会抽作样本的这种抽样方法。 3、参数:从总体中计算所得的用以描述总体特征的数值,称为参数。
4、概率事件原理:某事件发生的概率很小,人为地认为该事件不会出现,称为“小概率事件原理”。
四、简答题(每小题10分,共30分) 1、请简述均数假设检验的基本步骤。
第一步:提出假设:H0:x=x0(没有显著的差异);HA:x≠x0 (间有显著的差异);其中H0为原假设,HA为备选假设。------------------------------------------------------ --------2分
第二步:根据题和需要,选取a值(a=0.05或者a=0.01) ----------- ----------4分 第三步:利用Excel自带公式或数据分析库计算概率值。-----------------8分 第四步:根据第三的计算结果,对题中的问题进行推断。----------------10分
2、检验与t检验的区别是什么?并写出t检验的步骤,F检验的步骤。 t检验和F检验均是平均数的差异显著性检验的两种方法,但前种方法仅是两个平均数的差异显著性检验,而后者是多个平均数差异显著性检验。 --------------------------------4分 t检验的步骤是:1.提出假设
2.构造统计量t
3.查表找出两个小概率的t值 4.判断
-------------------------------7分 F检验的步骤是:1。计算平方和与自由度
2.F值的计算 3.多重比较 --------------- ---10分
五、计算题(共15分)
1、某车间用1台包装机装葡萄糖,额定标准为每袋净重0.5kg,包装机正常工作称糖服从正态分布,且根据长期经验知其标准方差?=0.015。某天,为检验包装机工作是否正常,随机抽取9包糖,检测它们的称重(单位:kg)平均值为:0.511。问这天包装机工作是否正常?(取α=0.05) 解:1)设:H0:X0=X;(无显著差异,机器工作正常)
HA:X0≠X(有显著差异,机器工作不正常)------------- ------------2分 2)σx = 0.015÷3 = 0.005 ----------------------------------3分 3)u =(0.511-0.5)÷ 0.005 = 2.2 --------------------------4分 由于,u =2.2 > u0.05 = 1.96, --------------------------------------------------------5分 所以,检验的样本与标准之间有显著的差异,即该机器工作不正常。--------6分 四、计算题(每小题15分,共15分)
某车间用1台包装机装葡萄糖,额定标准为每袋净重0.5kg,包装机正常工作称糖服从正态分布,且根据长期经验知其标准方差?=0.015。某天,为检验包装机工作是否正常,随机抽取9包糖,检测它们的称重(单位:kg)平均值为:0.511。问这天包装机工作是否正常?(取α=0.05)
五、填空题(每空1分,共10分)
1、显著性检验又称 假设检验 ,是统计学的核心内容。 2、随机实验的每一个可能的结果称为 变数 。
3、通常把α称为显著性水平或置信系数,常用显著性水平有两个,它们是 0.05 和 0.01
4、当随机变量的正态分布的μ=0,?= 1 时,正态分布就转化成标准正态分布。 5、数据资料按其性质不同各分为 计数 资料和 计量 资料两种。 6、小概率事件原理判定的基础是 原假设 。
7、试验设计的三大基本原则是设置重复、 随机排列 和 局部控制 。 六、单项选择题(每小题1分,共20分)
1、在t 检验时,如果t = t0、01 ,此差异是: A、显著水平
B、极显著水平
C、无显著差异
D、没法判断
2、已知数据资料有10对数据,并呈现线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A、9、1和8
B、1、8和9
C、8、1和9
D、 9、8和1
3、 观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为 A、偶然误差
B、系统误差
C、疏失误差
D、统计误差
4、 在均数假设检验中,当样本的个数大于30时,通常选择 检验。 A、 t-检验
B、u-检验
C、F-检验
D、都可以
5、 生物统计中t检验常用来检验 A、两均数差异比较
B、两个数差异比较
C、两总体差异比较
D、多组数据差异比较
6、百分数检验中,只有np和nq都大于 时,可用u或t检验。 A、 30
B、 20
C、 10
D、 5
7、 下面一组数据中属于计量资料的是 A、产品合格数
B、抽样的样品数
C、病人的治愈数
D、产品的合格率
8、平均数是反映数据资料 性的代表值。 A、变异性
B、集中性
C、差异性
D、独立性
9、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A、0.11
B、8.64
C、2.88
D、0.32
10、变异系数是衡量样本资料 程度的一个统计量。 A、变异
B、同一
C、集中
D、分布
11、在假设检验中,计算的检验统计量与事件发生的概率之间存在的关系是 。 A、正比关系
B、反比关系
C、加减关系
D、没有关系
12、下列那种措施是减少统计误差的主要方法。 A、提高准确度
B、提高精确度
C、减少样本容量
D、增加样本容量
13、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A、18
B、12
C、10
D、5
14、多重比较是对各个处理间的差异显著性检验的一种方法,它是对各处理的 间进行多重比较。 A、统计数
B、变数
C、F值
D、平均数
15、在X2检验中,当自由度为 时,需要对在X2检验的连续性进行矫正。 A、1
B、2
C、3
D、4
16、已回归方程的决定系是0.81,那么此回归方程的相关系数是 。B A、0.6561
B、0.9
C、0.59
D、0.81
17、下列数值属于参数的是: A、总体平均数
B、自变量
C、依变量
D、样本平均数
18、相关系数显著性检验常用的方法是 A、t-检验和u-检验
B、t-检验和X2-检验 C、t-检验和F检验
D、F检验和X2-检验
19、抽取样本的基本首要原则是 A、统一性原则
B、随机性原则
C、完全性原则
D、重复性原则
20、一组成组数据资料,每组具有10个观察值。该配对资料的自由度是 A、20
七、名词解释(每小题5分,共25分)
1、总体:总体是指研究对象的全体,也就是我们所指事件的全体。 2、统计量: 从样本中计算所得的数值称为统计量。
3随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。
4平均数:是反映数据资料集中性的代表值。
八、简答题(每小题10分,共30分) 1、请简述显著性检验的判定标准。
第一步:提出假设:H0:x=x0(没有显著的差异);HA:x≠x0 (间有显著的差异);其中H0为原假设,HA为备选假设。 -----------------------------2分
第二步:根据题和需要,选取a值(a=0.05或者a=0.01) -------------------------------4分 第三步:利用Excel自带公式或数据分析库计算概率值。------------------------------ 8分 第四步:根据第三的计算结果,对题中的问题进行推断。-----------------------------10分
2、简述方差分析的基本步骤
F检验均是平均数的差异显著性检验的一种方法,是多个平均数差异显著性检验。
B、19
C、18
D、9
---------------------------------------------------------2分 F检验的步骤是:1。计算平方和与自由度 -----------------------------------------------4分
2.F值的计算 ------------------------------------------------8分 3.多重比较 ---------------------------------------------------10分
九、计算题(每小题15分,共15分)
为了确定大白鼠的血糖减少量y和胰岛素A注射剂量x之间的关系,对在相同条件下繁殖的10只大白鼠分别注射胰岛素A的不同剂量Xi后,测得各鼠血糖减少量Yi,数据如下。试建立血糖减少量(y)对胰岛素A注射剂量(x)的直线回归方程。
表 血糖减少量(y)与胰岛素A注射剂量(x)测定结果表 单位: g 胰岛素A剂量 0.20 血糖减少量
28
0.25 34
0.30 35
0.35 44
0.40 47
0.45 50
0.50 54
0.55 56
0.60 65
0.65 66
解:1。 作散点图 ------------------------------------ --------4 分
2.计算回归截距和回归系数
SSX=0。20625 SSY=1498。9 --------------------------------------------8分 SPXY=17。425
b=84。4848 a=11。994
回归方程:y=11。994+84。4848x ----------------------------------------------13分 3.回归直线的误差估计 SY=1。8286
《生物统计学》基本知识题
一、填空题 第一章
1.填写下列符号的统计意义:① SS ② S x ③ S ④ SP xy。
2.t检验、u检验主要用于____ 组数据的差异显著性检验; F检验主要用于_____ 组数据的差异显著性检验。
3.试验误差指由 因素引起的误差,它不可 ,但可 以 和 。
2
4.参数是由____计算得到的,统计量是由____计算得到的。
5.由样本数据计算得到的特征数叫 ,由总体数据计算得到的特征数叫 。
9.一般将 原因产生的误差叫试验误差,它 避免,但可以 和 。 第二章
4.变异系数可用于当两个样本的 、 不同时变异程度的比较。变异系数的计算公式为 。
5.变异系数可用于当两个样本的 、 不同时 的比较。变异系数的计算公式为 。
7.连续性随机变量等组距式次数分布表的编制方法步骤为:
①_____、②____、③____、④____、⑤___。
8.计算标准差的公式是S= 。
9.变异系数的计算公式是CV= 。
10. 标准差的作用是① 、② 、③ 。 12.算术平均数的两个重要性质是① ② 。
13.样本平均数的标准差叫 。它与总体标准差的关系是 。 第三章
1.若随机变量x~N(μ,σ),欲将其转换为u~N(0,1), 则标准化公式为u= 。 第四
1.统计量与参数间的误差叫 ,其大小受① ② ③ 的影响,其大小可以用 来描述,计算公式为 。
2.抽样误差是指 之差。抽样误差的大小可用 来表示。影响抽样误差的因素有 、 和 。
6.在两个均数的显著性检验中,若检验结果是差异显著,则说明 。 7.在显著性检验时,当H0是正确的,检验结果却否定了H0,这时犯的错误是: 型错误。
8. 显著性检验时,犯Ⅰ型错误的概率等于 。 9.显著性检验分为_______ 检验和______检验。
10.显著性检验的方法步骤为: 、 、 。
2
12.若 服从N(第五章
,
2
)分布,则
值服从 分布, 值服从 分布。
1.方差分析是以 为检验对象的。在实际分析时常常以 作为它的估计值。
2.多重比较的方法有① 和② 两类;①一般适用于 组均数的检验,②适用于 组均数间的检验。
3.多重比较的LSD法适用于 组均数比较;LSR法适用于 组均数间的比较。
4.多重比较的方法有 和 两类。前者一般用于 组均数检验,后者又包含 和 法,适用于 组均数的比较。 第六章
1.χ 检验中,连续性矫正是指用 性分布检验 性数据所产生的差异,当 或 时,必须进行矫正。
2.在χ检验时,当 和 时必须进行连续性矫正。
3.χ检验中,当 或 时,必须进行连续性矫正,矫正方法有_____ 和_____ 两种。 4.χ检验的计算公式为χ= ,当 、 时,必须矫正, 其矫正方法为 、 。 第七章
1.在直线相关回归分析中,相关系数显著,说明两变量间 直线相关关系。 2.相关系数 的大小,说明相关的紧密程度,其 说明相关的性质。
相关系数r是用来描述两变量之间相关的 和 的指标,r 的正负号表示相关的 ,r的绝对值大小说明相关的 。
3.变量间存在的 关系,统计上称为相关关系。 4.回归分析中 表示 ,byx表示, 。
5.在回归方程中, 表示依变量的 ,b表示 ,a表示 。 6.已知r=-0.589*,则变量间存在 的 直线相关关系。
7.统计分析中,用统计量 来描述两个变量间的直线相关关系,其取值范围为 ,其绝对值的大小说明相关的 ,其正负符号说明相关的 。 第九章
1.试验设计的基本原则是 、 和 。 二、单选题
2
2
222
第二章
1.比较胸围与体重资料的变异程度,以 最好。
a.标准差 b.均方 c.全距 d.变异系数 2.比较身高与体重两变量间的变异程度,用统计量 较合适。 ①CV ②S ③R ④S 4.若原始数据同加(或同减)一个常数,则 。 a. 不变,S改变 b.S不变, 改变 c.两者均改变 d.两者均不改变 5.比较身高和体重资料的变异程度,以 指标最好。 a.CV b.S c.R d.S6.离均差平方和的代表符号是 。
a.∑(x- ) b.SP c.SS 7 .样本离均差平方和的代表符号是 。 ①S ②
2
2
2
2
③
④SS
8. 愈小,表示用该样本平均数估计总体均数的可靠性愈大。 ①变异系数 ②标准差 ③全距 ④标准误
《生物统计学》试题(A)
一、名词解释 (每题2分,共20分)
平均数与众数 总体与样本 数量性状资料与质量性状资料 参数与统计数 成组数据与成对数据 接受区与否定区 两尾测验与单尾测验 数学模型与期望均方 简单相关、偏相关与多元相关 相关系数与决定系数
二、选择题(请将所选答案填在下表中,每题1分,共10分) 题号 所选答案 1 2 2 3 4 5 6 7 8 9 10 1.二项分布、Poisson分布、正态分布各有几个参数:( )
A、 (1,1,1 ) B、 (2,2,2) C、 (2,1,2) D、 (2,2,1 ) 2.第一类错误是下列哪一种概率: ( )
A、 P(接受H0| H0为假) B、 P(否定H0| H0为假) C、 P(接受H0| H0为真) D、 P(否定H0| H0为真)
3.测量某医学指标,得到500个性质相同且近似服从正态分布的实验数据,求得算术平均数(x),标准差(s)和标准误(sx),则区间[x-1.960s,
( ) x+1.960s]所代表的含义为:
A、它是x的99%置信区间 B、它是总体平均数?的5%置信区间 C、它是该医学指标的95%正常值范围 D、它是该医学指标的99%正常值范围 4.x、 s和sx同上题,试问区间[x-2.576sx,
( ) x+2.576sx]所代表的含义为:
A、它是总体平均数?的99%置信区间 B、它是x的99%置信区间
C、它是该医学指标的95%正常值范围 D、它是总体平均数?的95%置信区间 5.统计学中,“标准误”的正确解释是:( )
A、样本均值的标准差 B、样本率的标准差 C、标准差的标准差 D、统计量的标准差 6.变异系数的定义式为:( )
A、CV=(x·s)×100% B、CV= (x/s)×100% C、CV= (s/x)×100% D、CV= (s2/x)×100% 7.u、t和F检验的共同前提条件是( )
A、方差齐性(同质性) B、正态性 C、可加性 D、正态性和方差齐性(同质性) 8.两因素A、B之间有显著的交互作用,意味着:( ) A、 因素A的作用随因素B的作用增强而增强 B、 因素A的作用随因素B的作用增强而减弱
C、一个因素的各水平对试验结果的影响随另一个因素水平的改变而改变 D、一个因素的各水平对试验结果的影响不随另一个因素水平的改变而改变 9.有资料如下:
两种劳动类型的人的血清胆固醇水平(mg%) 劳动类型 脑力劳动 体力劳动
人数 537 643
均值 185.6 178.3
标准差 27.8 31.3
问有哪些方法可用来比较两种劳动类型的人的血清胆固醇水平之间的差别是否有显著性意义?( ) A、t测验或u测验 B、?2测验 C、相关分析 D、回归分析
10.设ρ为总体相关系数,根据实际资料算得样本相关系数r后,需进行显著性检验,其零假设应该为:( ) A、H0:r=0 B、H0:r≠0 C、H0:ρ=0 D、H0:ρ≠0
三、填空题(每空1分,共20分)
1.平均数是反映样本( )性的特征数,平均数有( )、( )、( )、( )等。
2.常用的变异数有( )、( )、( )、( )。
3.根据小概率事件原理所建立的检验方法称为( ),生物统计中通常用( )和( )作为显著性水平。
4.方差分析应该满足三个条件:( )、( )、( )。若上述条件满足不够,则必须采取资
料的转换,转换的方法有( )、( )、( )等。
5.对于次数资料X2检验,可以分为( )和( )两类。
四、简答题 (每题5分,任选4题)
1.举例说明生物性状中哪类性状及情况服从正态分布?二项分布?泊松分布? 2.试述统计假设测验的方法和步骤。
3.试述方差分析的基本假设。方差分析时数据转换的方法主要有哪几种? 4.LSD法、SSR测验和q测验间有何异同?
5.什么是卡平方(?2)测验?如何应用?2测验进行适合性测验和独立性测验?
五、简单计算题 (每题10分,任选2题)
1.一种遗传疾病检测的敏感性为95%,而其专一性为98%。假定该遗传病在群体中的发病率为1/1000,试计算某人经检测为阳性,而实际上也是该遗传病患者的可能性。(提示:若A表示某人确实患该遗传病,B表示某人检测为该遗传病患者,95%敏感性意味着Pr(B|A)=0.95,98%专一性意味着Pr(B|notA)=0.02)
2.请选用合适的变异指标,初略地评价下列两组数据的变异度何者较大?6只中年大鼠谷丙转氨酶含量(u/L, X1)和白蛋白含量(g/L, X2)的测定结果如下:
鼠号 X1 X2
3.某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义?
患者编号 治疗前血红蛋白 治疗后血红蛋白
4.某研究者测得10名3岁儿童的体重(X:kg)与体表面积(Y:×100cm2),并求得Y随X变化的直线
?=2.5212+0.2385X,相关系数r=0.5779。问此直线回归方程是否有显著性意义? 回归方程为Y1 38.5 28.0 2 36.0 26.0 3 41.1 30.0 4 39.1 24.0 5 6 43.2 64.8 28.0 30.0 1 65 82 2 75 112 3 50 125 4 76 85 5 65 80 6 72 7 68 105 128 附录:
附表1 学生氏t值表(两尾)
自由度 df 6 7 8 9 概率值(P) 0.20 1.440 1.415 1.397 1.383 0.10 0.05 0.01 0.005 4.317 4.029 3.833 3.690 1.943 2.447 3.707 1.895 2.365 3.499 1.860 2.306 3.355 1.833 2.262 3.250 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.812 2.228 3.169 1.796 2.201 3.106 1.782 2.179 3.055 1.771 2.160 3.012 1.761 2.145 2.977 1.753 2.131 2.947 1.746 2.120 2.921 1.740 2.110 2.898 1.734 2.101 2.878 1.729 2.093 2.861 1.725 2.086 2.845 1.721 2.080 2.831 1.717 2.074 2.819 1.714 2.069 2.807 1.711 2.064 2.797 1.708 2.060 2.787 3.581 3.497 3.428 3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.135 3.119 3.104 3.091 3.078 附表2 ?值表(右尾)
自由度 df 1 2 3 4 5
附表3 r和R的5%和1%显著值
自
由概率 度 P df 1 2 3 4 5
变数的个数(M) 2
3
4
概率值(P) 0.1
0.05 0.01
0.005 7.88 10.60
22.71 3.84 6.63 4.61 5.99 9.21
6.25 7.81 11.34 12.84 7.78 9.49 13.28 14.86 9.24 11.07 15.09 16.75
0.05 0.997 0.999 0.999 0.01 1.000 1.000 1.000 0.05 0.950 0.975 0.983 0.01 0.990 0.995 0.997 0.05 0.878 0.930 0.950 0.01 0.959 0.977 0.983 0.05 0.811 0.881 0.912 0.01 0.917 0.949 0.962 0.05 0.754 0.836 0.874
0.01 0.875 0.917 0.937 6 7 8 9
0.05 0.707 0.795 0.839 0.01 0.834 0.886
0.911
0.05 0.666 0.758 0.807 0.01 0.798 0.855 0.885 0.05 0.632 0.726 0.777 0.01 0.765 0.827 0.860 0.05 0.602 0.697 0.750 0.01 0.735 0.800 0.837 10 0.05 0.576 0.671 0.726
0.01 0.708 0.776 0.814