好文档 - 专业文书写作范文服务资料分享网站

最小二乘法拟合原理

天下 分享 时间: 加入收藏 我要投稿 点赞

最小二乘拟合

在物理实验中经常要观测两个有函数关系的物理量。根据两个量的许多组观测数据来确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。这类问题通常有两种情况:一种是两个观测量x与y之间的函数形式已知,但一些参数未知,需要确定未知参数的最佳估计值;另一种是x与y之间的函数形式还不知道,需要找出它们之间的经验公式。后一种情况常假设x与y之间的关系是一个待定的多项式,多项式系数就是待定的未知参数,从而可采用类似于前一种情况的处理方法。

一、最小二乘法原理

在两个观测量中,往往总有一个量精度比另一个高得多,为简单起见把精度较高的观测量看作没有误差,并把这个观测量选作x,而把所有的误差只认为是y的误差。设x和y的函数关系由理论公式

y=f(x;c1,c2,……cm) (0-0-1)

给出,其中c1,c2,……cm是m个要通过实验确定的参数。对于每组观测数据(xi,yi)i=1,2,……,N。都对应于xy平面上一个点。若不存在测量误差,则这些数据点都准确

落在理论曲线上。只要选取m组测量值代入式(0-0-1),便得到方程组

yi=f(x;c1,c2,……cm) (0-0-2)

式中i=1,2,……,m.求m个方程的联立解即得m个参数的数值。显然N

不能确定。

在N>m的情况下,式(0-0-2)成为矛盾方程组,不能直接用解方程的方法求得m个参数值,只能用曲线拟合的方法来处理。设测量中不存在着系统误差,或者说已经修正,则y的观测值yi围绕着期望值 摆动,其分布为正态分布,则yi的概率密度为

p?yi???1??yi?f?xi;c1,c2,......,cm?exp??22?i2??i???2?????,

?式中i是分布的标准误差。为简便起见,下面用C代表(c1,c2,……cm)。考虑各次测量是相互独立的,故观测值(y1,y2,……cN)的似然函数

L?1??1exp????2N?2??NN?1?2...??i?1?yiN2?f?x;C?????2?i??.

取似然函数L最大来估计参数C,应使

???yi?12i1i?f?xi;C???min2 (0-0-3)

取最小值:对于y的分布不限于正态分布来说,式(0-0-3)称为最小二乘法准则。若为正态分布的情况,则最大似然法与最小二乘法是一致的。因权重因子

?i?1/?i2,故式

(0-0-3)表明,用最小二乘法来估计参数,要求各测量值yi的偏差的加权平方和为最小。

根据式(0-0-3)的要求,应有

??ck???yi?12i2iN1i?f?xi;C??2?c?c?0?k?1,2,...,m?从而得到方程组

N

?f?x;C??Ck??c?c

?1,c?2,...,c?m?f?x;c??i?11?yi?f?xi;C???0??k?1,2,...,m? (0-0-4)

?解方程组(0-0-4),即得m个参数的估计值c1,c2,...,cm,从而得到拟合的曲线方程。

2然而,对拟合的结果还应给予合理的评价。若yi服从正态分布,可引入拟合的x量,

Nx2?

??i?1N12i?yi?f?xi;C??2 (0-0-5)

??????把参数估计c?c1,c2,...,cm代入上式并比较式(0-0-3),便得到最小的x2值

x2min?

22???yi?12i1i????f?xi;c2 (0-0-6)

2可以证明,xmin服从自由度v=N-m的x2分布,由此可对拟合结果作x2检验。 由x分布得知,随机变量xmin的期望值为N-m。如果由式(0-0-6)计算出xmin接近N-m

2(例如xmin?N?m),则认为拟合结果是可接受的;如果拟合结果与观测值有显著的矛盾。

2xmin?2N?m?2,则认为

二、直线的最小二乘拟合

曲线拟合中最基本和最常用的是直线拟合。设x和y之间的函数关系由直线方程

y=a0+a1x (0-0-7)

给出。式中有两个待定参数,a0代表截距,a1代表斜率。对于等精度测量所得到的N组数据(xi,yi),i=1,2……,N,xi值被认为是准确的,所有的误差只联系着yi。下面利用

最小二乘法把观测数据拟合为直线。

1.直线参数的估计

前面指出,用最小二乘法估计参数时,要求观测值yi的偏差的加权平方和为最小。对于等精度观测值的直线拟合来说,由式(0-0-3)可使

N (0-0-8)

最小即对参数a(代表a0,a1)最佳估计,要求观测值yi的偏差的平方和为最小。 根据式(0-0-8)的要求,应有

i?1??yi??a0?a1xi??2?a?a??a0??a1??yi?1Ni?1Ni??a0?a1xi???a1xi??2?a?a?0?a?1xi??0,??2??yi?ai?1N

??yi??a02?a?a?0?a?1xi??0.??2??yi?ai?1N整理后得到正规方程组

?0N?a?1?xi??yi,??a??0?xi?a?1?xi2??xiyi.a??

?1。即 解正规方程组便可求得直线参数a0和a1的最佳估计值a0和a?0a???x???y????x???xy??N??x????x? (0-0-10) N??xy????x???y???aN??x????x? (0-0-11)

2iiiii2i2iiiii12i2i2.拟合结果的偏差

?1是根据有误差的观测数据点计算出来的,它们不可避免由于直线参数的估计值a0和a地存在着偏差。同时,各个观测数据点不是都准确地落地拟合线上面的,观测值yi与对应

?于拟合直线上的yi这之间也就有偏差。

首先讨论测量值yi的标准差S。考虑式(0-0-6),因等精度测量值yi所有的?i都相同,可用yi的标准偏差S来估计,故该式在等精度测量值的直线拟合中应表示为

x2min??1S2?0??yi??ai?1N?1x??.?a22 (0-0-12)

已知测量值服从正态分布时,xmin服从自由度v=N-2的x分布,其期望值

x2min2?1S2?0??yi??ai?1N?1xi???a2?N?2.

2i由此可得yi的标准偏差

S?1N

?y??2i?1N?0?a?1xi??.??a (0-0-13)

?0a这个表示式不难理解,它与贝塞尔公式是一致的,只不过这里计算S时受到两参数?1估计式的约束,故自由度变为N-2罢了。 a和

式(0-0-13)所表示的S值又称为拟合直线的标准偏差,它是检验拟合结果是否有效的

重要标志。如果xy平面上作两条与拟合直线平行的直线

如图0-0-1所示,则全部观测数据点(xi,yi)的分布,约有68.3%的点落在这两条直

?0?a?1x?S,y??a?0?a?1x?S,y???a线之间的范围内。

图0-0-1 拟合直线两侧数据点的分布

下面讨论拟合参数偏差,由式(0-0-10)和(0-0-11)可见,直线拟合的两个参数估计?1是y的函数。因为假定x是精确的,所有测量误差只有y有关,故两个估计参数值a0和aiIi的标准偏差可利用不确定度传递公式求得,即

N?0????a??a??;Sa???1S?.Sa0???S1????i?1??yii?1??yi??

把式(0-0-10)与(0-0-11)分别代入上两式,便可计算得

N22?Sa0?S?xN2i2i2??x????x?i; (0-0-14)

2Sa1?SNN??x????x?2ii. (0-0-15)

三、相关系数及其显著性检验

当我们把观测数据点(xi,yi)作直线拟合时,还不大了解x与y之间线性关系的密切程度。为此要用相关系数ρ(x,y)来判断。其定义已由式(0-0-12)给出,现改写为另一种形式,并改用r表示相关系数,得

??xr?ii?x??yi?y?1/2?22?????x?x?x?y?i??i?i?i? (0-0-16)

式中x和y分别为x和y的算术平均值。r值范围介于-1与+1之间,即-1≤r≤1。当r>0时直线的斜率为正,称正相关;当r<0时直线的斜率为负,称负相关。当|r|=1时全部

数据点(xi,yi)都落在拟合直线上。若r=0则x与y之间完全不相关。r值愈接近±1则它们之间的线性关系愈密切。

最小二乘法拟合原理

最小二乘拟合在物理实验中经常要观测两个有函数关系的物理量。根据两个量的许多组观测数据来确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。这类问题通常有两种情况:一种是两个观测量x与y之间的函数形式已知,但一些参数未知,需要确定未知参数的最佳估计值;另一种是x与y之间的函数形式还不知道,需要找出它们之间的经验公式。后一种情况常假设x与y之间的关系是一个待定
推荐度:
点击下载文档文档为doc格式
3l5zc041348az813iuu9
领取福利

微信扫码领取福利

微信扫码分享