第1章统计数据的收集与整理
生物统计的概述 合理地进行调查或试验设计、 科学地整理 、 分 析 所 收 集 得来的资料是生物统计 (Biometrics)的根本任务。 生物统计是数理统计的原理和方法在生 物科学研究中的应用,是一门应用数学。 一、提供试验或调查设计的方法 试验设计这一概念有广义与狭义之分: 广义的试验设计是指试验研究课题设计,
也就是指整个试验计划的拟定 , 包含课题名称、试验目的,研究依据、内容及预期达到的
效果,试验方案,供试单位的选取、重复数的确定、试验单位的分组,试验的记录项目和要
求,试验结果的分析方法,经济效益或社会效益的估计 , 已具备的条件 , 需要购置的仪器设
备,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文撰 写等内容。
狭义的试验设计主要是指试验单位 (如动 物试验的畜、禽 )的选取、重复数目的确定及 试验单位的分组。生物统计中的试验设计主要 指狭义的试验设计。合理的试验设计能控制和 降低试验误差,提高试验的精确性,为统计分析获得试验处理效应和试验误差的无偏估计提 供必要的数据。
二、提供整理、分析资料的方法整理资料的基本方法是根据资料的特性将
其整理成统计表、 绘制成统计图。 通过统计表、图可以大致看到所得资料集中、离散的情 况。并利用所收集得来的数据计算出几个统计 量,以表示该资料的数量特征、估计相应的总 体参数。
统计分析 最重要的内容是 差异显著性检 验。通过抽样调
查或控制试验,获得的是具有 变异的资料。产生变异的原因是什么?是由于 进行比较的处理间,例如不同品种、不同饲料 配方间有实质性的差异或是由于无法控制的偶 然因素所引起?显著性检验的目的就在于承认 并尽量排除这些无法控制的偶然因素的干扰, 将处理间是否存在本质差异揭示出来。显著性 检验的方法很多,常用的有:
t 检验――主要用于检验两个处理平均数 差异是否显著; 方差分析――主要用于检验多个处理平均 数间差异是否显著;
检验 ―― 主要用于由质量性状得来2 的次数资料的显著性检验等。
统计分析的另一个重要内容是对试验指标 或畜禽性状间的关系进行研究,或者研究它们
之间的联系性质和程度,或者寻求它们之间的联系形式,即进行相关分析与回归分析。通过
对资料进行相关、回归分析,可以揭示出试验指标或性状间的内在联系,为畜禽、水产新品 种选育等提供强有力的依据。 还有一类统计分析方法不考虑资料的分布类型 , 也不事先 对
有关 总体参数进行估 算,这类统计分析方法叫非参数检验法。非
参数检验法计算简便。当通常的检验方法对畜禽、水产科研中的某些资料无能为力时, 非参数检验法则正好发挥作用。 第二节 生物统计的常用术语一、总体与样本根据研究目的确定的研究对象的全体称为 总体(population); 总体中的一个研究单位称为个体
(individual);总体的一部分称为样本(sample); 含有有限个个体的总体称为有限总体; 包含有无限多个个体的总体叫无限总体;
在实际研究中还有一类假想总体。例如进 行几种饲料的饲养试验,实际上并不存在用这 几种饲料进行饲养的总体,只是假设有这样的 总体存在,把所进行的试验看成是假想总体的 一个样本; 样本中所包含的个体数目叫样本容量或大 小(sample size),样本容量常记为n。通 常把n≤30的样本叫小样本,n 30的样本 叫大样本。 研究的目的是要了解总体,然而能观测到 的却是样本,通过样本来推断总体是统计分析 的基本特点。 为了能可靠地从样本来推总体,要求样本 具有一定的含量和代表性。 只有从 总体 随机抽取 的样本才具有代表 性。所谓随机抽取(random sampling) 的 样本是指总体中的每一个个体都有同等的机会 被抽取组成样本。
样本毕竟只是总体的一部分,尽管样本具 有一定的含量也具有代表性,通过样本来推断 总体也不可能是百分之百的正确。有很大的可 靠性但有一定的错误率这是统计分析的又一特 点。 二、参数与统计量为了表示总体和样本的数量特征,需要计算出几 个特征数。 由总体计算的特征数叫参数(parameter); 由样本计算的特征数叫统计量(staistic)。 常用希腊字母表示参数,例如用μ表示总体平均 数,用σ表示总体标准差;
常用拉丁字母表示统计量,例如用平均数,用S表示样本标准差。
x 表 示样本
总体参数由相应的统计量来估计,例如用
x 估计μ,用S估计σ等。三、准确性与精确性准确性(accuracy)也叫准确度,指在调 查或试验中某一试验指标或性状的观测值与其 真值接近的程度。设某一试验指标或性状的真 值为μ,观测值为 x,若 x与μ相差的绝对值 |x-μ|小, 则观测值x的准确性高; 反之则 低。
精确性(precision)也叫精确度,指调查 或试验中同一试验指