得 分
科研方法
第三章
实验设计的基本要素:
实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。
实验设计的四原则: 对照原则 均衡原则 随机原则 重复原则
随机原则:
使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。
随机化的方法有多种,最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。
页脚内容1
得 分
拉丁方设计:
用r个拉丁字母排成r行r列的方阵,使每行及每列中每个字母都只出现一次,这样的方阵称为r阶拉丁方,或r×r拉丁方 正交设计
正交设计:
正交设计是一种高效、快速的多因素试验方法。它是利用一套规格化的正交表,使每次试验的因素及水平得到合理安排,通过试验结果的分析,获得有用的信息。除了分析主因素外,还可分析交互作用。
非条件logistic回归的公式,目的,用途
统计学
第一章
统计学家用总体这个术语来表示大同小异的对象全体。我们试图就某个总体下结论,这个总体便称为目标总体。资料常来源于目标总体中的一个部分,它称为研究总体。
页脚内容2
得 分
科学的办法是从研究总体中抽取少量有代表性的个体,称为抽样。
一些个体处于同一总体,就是指他们大同小异,具有同质性。
同一总体内的个体间存在差异又是绝对的,这种现象称为变异。
本书把变量分成定性与定量两种类型。定性变量中最常见的是分类变量或名义变量。最简单也最常用的分类变量是二分类变量。另一类定性变量是有序变量或等级变量。定量变量可以分为两种类型,离散型变量和连续型变量。离散型变量只能取整数值。连续型变量可以取实数轴上的任何数值。
变量只能由“高级”向“低级”转化:定量→有序→分类→二值;不能作相反方向的转化。在定量变量中,离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。
理论上,正态分布有两个参数:总体均数和总体方差。
这种由观察资料计算出来的量称为统计量。
第二章
页脚内容3
得 分
对连续型定量变量,频率分布表的编制步骤如下:
(1)计算极差(R),也称为全距,即数据最大值与最小值之差。
(2)确定组段数与组距,变量值个数较多时,组段数一般取10左右。每个组段的起点称为组段的下限,终点称为组段的上限,组距为上下限之差,按“组距≈R/预计的组段数”来估计。
(3)确定各组段的上、下限,分组时,第一组段应包含最小值,为了计算方便,组段下限一般取较整齐的数值。最后一个组段应包含最大值,在确定各组段的上下限,注意各组段要连续但不能重叠,故除最后一个组段外,其余组段应包含其下限值,不包含其上限值。 (4)列表
直方图(频率直方图),其横轴为血清铁含量,纵轴为频率密度,即频率/组距(直条面积等于相应组段的频率)。在组距相等时,直方图中矩形直条的高度与相应组段的频率成正比。可以看到,直方图的面积之和等于1,。
其值的分布具有对称的特点,这类分布常被称为对称分布。
频率分布是不对称的,这类分布称为偏峰分布。
页脚内容4
得 分
一般称这种峰向左侧偏移的分布为正偏峰分布。而峰向右侧偏移的分布称为负偏峰分布。
集中趋势与离散趋势,集中趋势与离散趋势同时存在,是总体分布的两个重要特征,描述集中趋势和离散趋势可较全面的反映所研究的变量。
1.算术均数(mean),算术均数简称均数,总体均数用希腊字母μ表示,样本均数用 表示。
(1)
直接法:计算公式为:
其中n为样本含量,X1,X2,…,Xn为观察值。大写的希腊字母Σ(读作sigma)。
(2)
频率表法:计算公式为:
其中f为各组段的频数,X0为各组段的组中值,X0=(组段上限+组段下限)/2。各组段的频数在这里起了“权数”的作用,各组段的频率(f/n)称为权重系数。故频率表法也称加权法。
页脚内容5