第二章 实验数据误差分析和数据处理
第一节 实验数据的误差分析
由于实验方法和实验设备的不完善,周围环境的影响,以及人的观察力,测量程序等限制,实验观测值和真值之间,总是存在一定的差异。人们常用绝对误差、相对误差或有效数字来说明一个近似值的准确程度。为了评定实验数据的精确性或误差,认清误差的来源及其影响,需要对实验的误差进行分析和讨论。由此可以判定哪些因素是影响实验精确度的主要方面,从而在以后实验中,进一步改进实验方案,缩小实验观测值和真值之间的差值,提高实验的精确性。
一、误差的基本概念
测量是人类认识事物本质所不可缺少的手段。通过测量和实验能使人们对事物获得定量的概念和发现事物的规律性。科学上很多新的发现和突破都是以实验测量为基础的。测量就是用实验的方法,将被测物理量与所选用作为标准的同类量进行比较,从而确定它的大小。
1.真值与平均值
真值是待测物理量客观存在的确定值,也称理论值或定义值。通常真值是无法测得的。若在实验中,测量的次数无限多时,根据误差的分布定律,正负误差的出现几率相等。再经过细致地消除系统误差,将测量值加以平均,可以获得非常接近于真值的数值。但是实际上实验测量的次数总是有限的。用有限测量值求得的平均值只能是近似真值,常用的平均值有下列几种:
(1) 算术平均值 算术平均值是最常见的一种平均值。
设x1、x2、……、xn为各次测量值,n代表测量次数,则算术平均值为
nxix1?x2?????xn? x??i?1 (2-1)
nn(2) 几何平均值 几何平均值是将一组n个测量值连乘并开n次方求得的平均值。即
x几?nx1?x2???xn (2-2)
(3)均方根平均值
nx?x?????x (2-3) ?i?1nn(4) 对数平均值 在化学反应、热量和质量传递中,其分布曲线多具有对数的特性,在这种情况下表征平均值常用对数平均值。
设两个量x1、x2,其对数平均值
x?x1?x2?x1?x2 (2-4)
对xlnx1?lnx2ln1x2 x均?21222n?x2i应指出,变量的对数平均值总小于算术平均值。当x1/x2≤2时,可以用算术平均值代替对数平均值。
当x1/x2=2,x对=1.443, x?1.50, (x对-x)/x对=4.2%, 即x1/x2≤2,引起的误差不超过4.2%。
以上介绍各平均值的目的是要从一组测定值中找出最接近真值的那个值。在化工实验和科学研究中,数据的分布较多属于正态分布,所以通常采用算术平均值。
2.误差的分类
根据误差的性质和产生的原因,一般分为三类:
(1)系统误差 系统误差是指在测量和实验中未发觉或未确认的因素所引起的误差,而这些因素影响结果永远朝一个方向偏移,其大小及符号在同一组实验测定中完全相同,当实验条件一经确定,系统误差就获得一个客观上的恒定值。
当改变实验条件时,就能发现系统误差的变化规律。
系统误差产生的原因:测量仪器不良,如刻度不准,仪表零点未校正或标准表本身存在偏差等;周围环境的改变,如温度、压力、湿度等偏离校准值;实验人员的习惯和偏向,如读数偏高或偏低等引起的误差。针对仪器的缺点、外界条件变化影响的大小、个人的偏向,待分别加以校正后,系统误差是可以清除的。
(2)偶然误差 在已消除系统误差的一切量值的观测中,所测数据仍在末一位或末两位数字上有差别,而且它们的绝对值和符号的变化,时而大时而小,时正时负,没有确定的规律,这类误差称为偶然误差或随机误差。偶然误差产生的原因不明,因而无法控制和补偿。但是,倘若对某一量值作足够多次的等精度测量后,就会发现偶然误差完全服从统计规律,误差的大小或正负的出现完全由概率决定。因此,随着测量次数的增加,随机误差的算术平均值趋近于零,所以多次测量结果的算数平均值将更接近于真值。
(3)过失误差 过失误差是一种显然与事实不符的误差,它往往是由于实验人员粗心大意、过度疲劳和操作不正确等原因引起的。此类误差无规则可寻,只要加强责任感、多方警惕、细心操作,过失误差是可以避免的。
3、精密度、准确度和精确度
反映测量结果与真实值接近程度的量,称为精度(亦称精确度)。它与误差大小相对应,测量的精度越高,其测量误差就越小。“精度”应包括精密度和准确度两层含义。
(1)精密度:测量中所测得数值重现性的程度,称为精密度。它反映偶然误差的影响程度,精密度高就表示偶然误差小。
(2)准确度 测量值与真值的偏移程度,称为准确度。它反映系统误差的影响精度,准确度高就表示系统误差小。
(3)精确度(精度) 它反映测量中所有系统误差和偶然误差综合的影响程度。
在一组测量中,精密度高的准确度不一定高,准确度高的精密度也不一定高,但精确度高,则精密度和准确度都高。
为了说明精密度与准确度的区别,可用下述打靶子例子来说明。如图2-1所示。
图2-1(a)中表示精密度和准确度都很好,则精确度高;图2-1(b)表示精密度很好,但准确度却不高;图2-1(c)表示精密度与准确度都不好。在实际测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值。
学生在实验过程中,往往满足于实验数据的重现性,而忽略了数据测量值的准确程度。绝对真值是不可知的,人们只能订出一些国际标准作为测量仪表准确性的参考标准。随着人类认识运动的推移和发展,可以逐步逼近绝对真值。
(a) (b) (c)
图 2-1 精密度和准确度的关系
4、误差的表示方法
利用任何量具或仪器进行测量时,总存在误差,测量结果总不可能准确地等于被测量的真值,而只是它的近似值。测量的质量高低以测量精确度作指标,根据测量误差的大小来估计测量的精确度。测量结果的误差愈小,则认为测量就愈精确。
(1)绝对误差 测量值X和真值A0之差为绝对误差,通常称为误差。记为:
D?X?A0 (2-5) 由于真值A0一般无法求得,因而上式只有理论意义。常用高一级标准仪器的示值作为实际值A以代替真值A0。由于高一级标准仪器存在较小的误差,因而A不等于A0,但总比X更接近于A0。X与A之差称为仪器的示值绝对误差。记为
d?X?A (2-6) 与d相反的数称为修正值,记为
C??d?A?X (2-7) 通过检定,可以由高一级标准仪器给出被检仪器的修正值C。利用修正值便可以求出该仪器的实际值A。即
A?X?C (2-8) (2)相对误差 衡量某一测量值的准确程度,一般用相对误差来表示。示值绝对误差d与被测量的实际值A的百分比值称为实际相对误差。记为
?A?d?100% (2-9) Ad?100% (2-10) X以仪器的示值X代替实际值A的相对误差称为示值相对误差。记为
?X?一般来说,除了某些理论分析外,用示值相对误差较为适宜。
(3)引用误差 为了计算和划分仪表精确度等级,提出引用误差概念。其定义为仪表示值的绝对误差与量程范围之比。
?A?示值绝对误差d?100%??100% (2-11)
量程范围Xnd-- 示值绝对误差;
Xn-- 标尺上限值-标尺下限值。
(4)算术平均误差 算术平均误差是各个测量点的误差的平均值。
?di i?1,2,?,n (2-12) ?平?nn—测量次数;
di—为第 i次测量的误差。 (5)标准误差 标准误差亦称为均方根误差。其定义为
???dn2i (2-13)
上式使用于无限测量的场合。实际测量工作中,测量次数是有限的,则改用下式
???d2i (2-14)
n?1 标准误差不是一个具体的误差,?的大小只说明在一定条件下等精度测量集合所属的每一个观测值对其算术平均值的分散程度,如果?的值愈小则说明每一次测量值对其算术平均值分散度就小,测量的精度就高,反之精度就低。
在化工原理实验中最常用的U形管压差计、转子流量计、秒表、量筒、电压等仪表原则上均取其最小刻度值为最大误差,而取其最小刻度值的一半作为绝对误差计算值。
5、测量仪表精确度
测量仪表的精确等级是用最大引用误差(又称允许误差)来标明的。它等于仪表示值中的最大绝对误差与仪表的量程范围之比的百分数。
(2-15) dmax最大示值绝对误差?nmax?量程范围?100%?Xn?100%式中:δmax——仪表的最大测量引用误差;
dmax——仪表示值的最大绝对误差; Xn——标尺上限值—标尺下限值。
通常情况下是用标准仪表校验较低级的仪表。所以,最大示值绝对误差就是被校表与标准表之间的最大绝对误差。
测量仪表的精度等级是国家统一规定的,把允许误差中的百分号去掉,剩下的数字就称为仪表的精度等级。仪表的精度等级常以圆圈内的数字标明在仪表的面板上。例如某台压力计的允许误差为1.5%,这台压力计电工仪表的精度等级就是1.5,通常简称1.5级仪表。
仪表的精度等级为a,它表明仪表在正常工作条件下,其最大引用误差的绝对值δmax不能超过的界限,即
d??max?100%?a% (2-16)
nmaxXn由式(2-16)可知,在应用仪表进行测量时所能产生的最大绝对误差(简称误差限)为
dmax?a%?Xn (2-17) 而用仪表测量的最大值相对误差为
dX??max?a%?n (2-18)
nmaxXnX由上式可以看出,用只是仪表测量某一被测量所能产生的最大示值相对误差,不会超过仪
表允许误差a% 乘以仪表测量上限Xn与测量值X的比。在实际测量中为可靠起见,可用下式对
仪表的测量误差进行估计,即
?m?a%?Xn (2-19) X[例2-1] 用量限为5A,精度为0.5级的电流表,分别测量两个电流,I1 =5A,I2 =2.5A,试求测量I1和I2的相对误差为多少?
I5??a%?n?0.5%??0.5%
m1I15?m2?a%?In5?0.5%??1.0% I22.5由此可见,当仪表的精度等级选定时,所选仪表的测量上限越接近被测量的值,则测量的
误差的绝对值越小。
[例2-2] 欲测量约90V的电压,实验室现有0.5级0-300V和1.0级0-100V的电压表。问选用哪一种电压表进行测量为好?
用0.5级0-300V的电压表测量90V的相对误差为
U300??a%?n?0.5%??1.7%
m0.51U90用1.0级0-100V的电压表测量90V的相对误差为
U100??a%?n?1.0%??1.1%
m1.02U90上例说明,如果选择得当,用量程范围适当的1.0级仪表进行测量,能得到比用量程范围
大的0.5级仪表更准确的结果。因此,在选用仪表时,应根据被测量值的大小,在满足被测量数值范围的前提下,尽可能选择量程小的仪表,并使测量值大于所选仪表满刻度的三分之二,即X>2Xn/3 。这样就可以达到满足测量误差要求,又可以选择精度等级较低的测量仪表,从而降低仪表的成本。
二、有效数字及其运算规则
在科学与工程中,该用几位有效数字来表示测量或计算结果,总是以一定位数的数字来表示。不是说一个数值中小数点后面位数越多越准确。实验中从测量仪表上所读数值的位数是有限的,而取决于测量仪表的精度,其最后一位数字往往是仪表精度所决定的估计数字。即一般应读到测量仪表最小刻度的十分之一位。数值准确度大小由有效数字位数来决定。
1、 有效数字
一个数据,其中除了起定位作用的“0”外,其他数都是有效数字。如0.0037只有两位有效数字,而370.0则有四位有效数字。一般要求测试数据有效数字为4位。要注意有效数字不一定都是可靠数字。如测流体阻力所用的U形管压差计,最小刻度是1mm,但我们可以读到0.1mm,如342.4mmHg。又如二等标准温度计最小刻度为0.1℃,我们可以读到0.01℃,如15.16℃。此时有效数字为4位,而可靠数字只有三位,最后一位是不可靠的,称为可疑数字。记录测量数值时只保留一位可疑数字。
为了清楚地表示数值的精度,明确读出有效数字位数,常用指数的形式表示,即写成一个小数与相应10的整数幂的乘积。这种以10的整数幂来记数的方法称为科学记数法。
5
如 75200 有效数字为4位时,记为7.520*10
5
有效数字为3位时,记为7.52*10
5
有效数字为2位时,记为7.5*10