误差和分析数据处理 1 数据的准确度和精度
在任何一项分析工作中,我们都可以看到用同一个分析方法,测定同一个样品,虽然经过多少次测定,但是测定结果总不会是完全一样。这说明在测定中有误差。为此我们必须了解误差产生的原因及其表示方法,尽可能将误差减到最小,以提高分析结果的准确度。 1.1 真实值、平均值与中位数 (一)真实值
真值是指某物理量客观存在的确定值。通常一个物理量的真值是不知道的,是我们努力要求测到的。严格来讲,由于测量仪器,测定方法、环境、人的观察力、测量的程序等,都不可能是完善无缺的,故真值是无法测得的,是一个理想值。科学实验中真值的定义是:设在测量中观察的次数为无限多,则根据误差分布定律正负误差出现的机率相等,故将各观察值相加,加以平均,在无系统误差情况下,可能获得极近于真值的数值。故“真值”在现实中是指观察次数无限多时,所求得的平均值(或是写入文献手册中所谓的“公认值”)。 (二)平均值
然而对我们工程实验而言,观察的次数都是有限的,故用有限观察次数求出的平均值,只能是近似真值,或称
为最佳值。一般我们称这一最佳值为平均值。常用的平均值有下列几种:
(1)算术平均值
这种平均值最常用。凡测量值的分布服从正态分布时,用最小二乘法原理可以证明:在一组等精度的测量中,算术平均值为最佳值或最可信赖值。
式中: x1、x2??xn——各次观测值;n――观察的次数。 (2)均方根平均值
(3)加权平均值
设对同一物理量用不同方法去测定,或对同一物理量由不同人去测定,计算平均值时,常对比较可靠的数值予以加重平均,称为加权平均。 式中;x1、x2?xn——各次观测值;
w1、w2?wn——各测量值的对应权重。各观测值的权数一般凭经验确定。 (4)几何平均值 (5)对数平均值
以上介绍的各种平均值,目的是要从一组测定值中找出最接近真值的那个值。平均值的选择主要决定于一组观测值的分布类型,在化工原理实验研究中,数据分布较多属于正态分布,故通常采用算术平均值。 (三)中位数(xM)
一组测量数据按大小顺序排列,中间一个数据即为中位数。当测定次数为偶数时,中位数为中间相邻的两个数据的平均值。它的优点是能简便地说明一组测量数据的结果,不受两端具有过大误差的数据的影响。缺点是不能充分利用数据。 1.2 准确度与误差
准确度与误差是指测定值与真实值之间相符合程度。准确度的高低常以误差的大小来衡量。即:误差越小,准确度越高;误差越大,准确度越低。误差有两种表示方法:绝对误差和相对误差。 1、绝对误差(E)
某物理量在一系列测量中,某测量值与其真值之差称绝对误差。实际工作中常以最佳值代替真值,测量值与最佳值之差称残余误差,习惯上也称为绝对误差。
绝对误差(E)=测定值(x)-真实值(T) 2、相对误差(RE)
为了比较不同测量值的精确度,以绝对误差与真值(或近似地与平均值)之比作为相对误差。
由于测定值可能大于真实值,也可能小于真实值,所以绝对误差和相对误差都有正、负之分。
绝对误差相同,相对误差可能相差很大。相对误差是指误差在真实值中所占的百分比率。相对误差不同说明它