心理和教育方面的实验或调查所得到的数据,大都具有随机变量的性质。而对这些随机变量的描述,仅有前一章所讲集中趋势的度量是不够的。集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。数据除典型情况之外,还有变异性的特点。对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有标准差或方差,全距,平均差,四分差及各种百分差等等。
第一节 方差与标准差
方差(Variance)也称变异数、均方。作为统计量,常用符号S表示,作为总体参数,常用符号σ表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。方差,在数理统计中又常称之为二阶中心矩或二级动差。它是度量数据分散程度的一个很重要的统计特征数。标准差(Standard deviation)即方差的平方根,常用S或SD表示。若用σ表示,则是指总体的标准差,本章只讨论对一组数据的描述,尚未涉及总体问题,故本
章方差的符号用S,标准差的符号用S。符号不同,其含义不完全一样,这一点望读者能够给予充分的注意。
一、方差与标准差的计算 (一)未分组的数据求方差与标准差
基本公式是:
2
22
(3—l a)
(3—1b)
表3—1说明公式3—1a与3—1b的计算步骤 表3—1 未分组的数据求方差与标准差
Xi 6 5 7 4 6 8 N=6 Xi—X=x 0 -1 l -2 0 2 ∑x=0 x=(Xi—X) 0 l 1 4 0 4 ∑x=10 222Xi 36 25 49 16 36 64 ∑Xi=226 22∑Xi=36
应用3—1公式的具体步骤:①先求平均数X=36/6=6;②计算Xi -X;③求(Xi - X)即离均差x;④将各离均差的平方求和 (∑x);⑤代入公式3—
2
2
2
1a与3—1b求方差与标准差。具体结果如下:
S=10/6=1.67
2
(二)已分组的数据求标准差与方差
数据分组后,便以次数分布表的形式出现,这时原始数据不见了,若计算方差与标准差可用下式:
(3—3a)
(3—3b)
式中d=(Xc - AM) / i,AM为估计平均数
Xc为各分组区间的组中值 f为各组区间的次数
N=Σf 为总次数或各组次数和
i为组距。
下面以表1—8数据为例,说明分组数据求方差与标准差的步骤:
表3—2 次数分布表求方差与标准差
分组 区间 96- 93- 90- 87- 84- 81- 78- 75- Xc 97 94 91 88 85 82 79 76 f 2 3 4 8 11 17 19 14 d 6 5 4 3 2 1 0 —1 fd 12 15 16 24 22 17 0 —14 fd 72 75 64 72 2计 算 S=3* (570/100 -(28/100))=50.5944 22244 S=7.113 17 0 14 72- 69- 66- 63- 60- i=3 73 70 67 64 61 10 7 3 l 1 —2 —3 —4 —5 —6 —20 —21 —12 —5 —6 40 63 48 25 36 Σfd=570 2 Σf=100 Σfd=28 具体步骤:
①设估计平均数AM,任选一区间的Xc充任;
②求d
⑧用f乘d,并计算Σfd; ④用d与fd相乘得fd,并求Σfd;
⑤代入公式计算。 二、方差与标准差的意义
方差与标准差是表示一组数据离散程度的最好的指标。其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。它基本具备一个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差都随之变化;②有一定的计算公式严密确
2
2