第二十章数据的分析
20.1 数据的集中趋势
20.1.1 平均数
1、算术平均数:
把一组数据的总和除以这组数据的个数所得的商.
x1?x2?????xn公式:
n使用:当所给数据x1,x2,…,xn中各个数据的重要程度相同时,一般使用该公式计算平均数. 2、加权平均数:
若n个数x1,x2,…,xn的权分别是w1,w2,…,wn,则
x1w1?x2w2?????xnwn,叫做这n个数的加权平均数.
w1?w2?????wn使用:当所给数据x1,x2,…,xn中各个数据的重要程度(权)不同时,一般选用加权平均数计算
平均数.
权的意义:权就是权重即数据的重要程度.
常见的权:1)数值、2)百分数、3)比值、4)频数等.
20.1.2 中位数和众数
1、中位数:
将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是
这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数. 意义:在一组互不相等的数据中,小于和大于它们的中位数的数据各占一半. 2、众数:
一组数据中出现次数最多的数据就是这组数据的众数. 特点:可以是一个也可以是多个.
用途:当一组数据中有较多的重复数据时,众数往往是人们所关心的一个量. 3、平均数、中位数、众数的区别:
平均数能充分利用所有数据,但容易受极端值的影响;中位数计算简单,它不易受极端值的影响,但不能
充分利用所有数据;当数据中某些数据重复出现时,人们往往关心众数,但当各个数据的重复次数大致相等时,众数往往没有意义.
20.2 数据的波动程度
1、极差:
一组数据中的最大数据与最小数据的差叫做这组数据的极差.
2、方差:
各个数据与平均数之差的平方的平均数,记作s2.用“先平均,再求差,然后平方,最后再平均”得到的
结果表示一组数据偏离平均值的情况,这个结果叫方差,计算公式是:
s2?1?x1?x??n???2?x2?x?22?????xn?x?
????意义:方差(s2)越大,数据的波动性越大,方差越小,数据的波动性越小.
结论:①当一组数据同时加上一个数a时,其平均数、中位数、众数也增加a,而其方差不变; ②当一组数据扩大k倍时,其平均数、中位数和众数也扩大k倍,其方差扩大k倍. 3、标准差:
标准差是方差的算术平方根.
2s??x?x???x212?x?????xn?xn?2??2