克里金插值法
克里金插值法又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域对区域化变量进行无偏最优估计的一种方法,是地统计学的主要容之一,由南非矿产工程师D. Matheron于1951年在寻找金矿时首次提出,法国著名统计学家G. Matheron随后将该方法理论化、系统化,并命名为Kriging,即克里金插值法。 1 克里金插值法原理
克里金插值法的适用围为区域化变量存在空间相关性,即如果变异函数和结构分析的结果表明区域化变量存在空间相关性,则可以利用克里金插值法进行插或外推。其实质是利用区域化变量的原始数据和变异函数的结构特点,对未知样点进行线性无偏、最优估计,无偏是指偏差的数学期望为0,最优是指估计值与实际值之差的平方和最小[1]。因此,克里金插值法是根据未知样点有限领域的若干已知样本点数据,在考虑了样本点的形状、大小和空间方位,与未知样点的相互空间关系,以及变异函数提供的结构信息之后,对未知样点进行的一种线性无偏最优估计。
假设研究区域a上研究变量Z(x),在点xi?A(i=1,2,……,n)处属性值为Z(xi),则待插点x0?A处的属性值Z(x0)的克里金插值结果Z*(x0)是已知采样点属性值Z(xi)(i=1,2,……,n)的加权和,即:
Z(x0)???iZ(xi) (1)
*i?1n式中
?i是待定权重系数。
其中Z(xi)之间存在一定的相关关系,这种相关性除与距离有关外,还与其相对方向变化有关,克里金插值方法将研究的对象称“区域化变量”
针对克里金方法无偏、最小方差条件可得到无偏条件可得待定权系数n)满足关系式:
?i (i=1,2,……,
??i?1ni?1 (2)
以无偏为前提,kriging方差为最小可得到求解待定权系数
?i的方程组:
?n?iC(xi,xj)???C(x0,xj)(j?1,2,??,n)???i?1 (3) ?n??i?1??i?1?式中,C(xi,xj)是Z(xi)和Z(xj)的协方差函数。 2 方法步骤
克里金插值法的应用步骤如下:
1、输入原始数据,即采样点,下面以输入三个采样点求待估插值为例来进行说明。如图1所示:
图1 采样点图示
2、网格化,选择区域的围和网格的大小,对区域进行网格化处理。 3、数据检验与分析,根据采样值是否合乎实际情况,剔除明显差异点。
4、直方图的计算,直方图有助于掌握区域变化的分布规律,以便决定是否对原始数据进行转换。
5、利用变异函数进行变异函数计算,了解变量的空间结构。 6、克里金插值估计 (1)待估点权重系数估计
利用多边形估计的方法,首先确定离待估点最近的采样点的权重,根据公式(4)进行采样点权重估计:
1diw ?i?n (4)
1?wi?1c?dc?(2)根据搜索策略选择合适的参估点,如图2:
图2 参估点图示
(3)根据已经求出的变异函数以及采样点数量,三个采样点列出三个等式,求出方程组的系数,公式为:
?C(1,1)C(1,2)C(1,3)???1??C(0,1)??C(2,1)C(2,2)C(2,3)??????C(0,2)? (5)
???2?????C(3,1)C(3,2)C(3,3)?????3????C(0,3)??(4)分析在各向同性条件下改变块金值与在块金值相同条件下改变各向异性对权重值的影响[2]。各向同性条件下改变块金值时对权重值的影响效果如图3(a),在块金值相同条件下改变各向异性对权重值带来的影响如图3(b):
(a) (b)
图3 各向同性条件下改变块金值与在块金值相同条件下改变各向异性对权重值的影响
(5)根据求出的权重值,代入公式(1),即可求得评估领域n个采样值的线性组合[2]。 克里金插值法的方法路线图如下:
导入数据 进行预测 数据分析 计算克里金系数 是否服从正态分布 是 是否存在趋势 否 根据数据选择合适的方法 否 数据变换 拟合理论半变异函数图 是 泛克里金方法 绘制经验半变异函数图 绘制方差变异云图 计算样点间的距离矩阵 按组统计平均距离及对应的平均方差 计算样点间的属性方差 按距离分组
图4 方法路线图
3 克里金插值法分类及适用类型
克里金插值法主要有以下几种类型:普通克里金(Ordinary Kriging)、简单克里金(Simple Kriging)、泛克里金(Universal Kriging)、协同克里金(Co-Kriging)、对数正态克里金(Logistic Normal Kriging)、指示克里金(Indicator Kriging)、概率克里金(Probability Kriging)和析取克里金(Disjunctive Kriging)等[1]。
克里金插值法可以简单地表达为:
Z(s)??(s)??(s) (6) 式中,s为不同位置的点,可以人为是用经纬度表示的空间坐标;Z(s)为s处的变量
值,它可以分解为确定趋势值?(s)和自相关随机误差?(s)。通过对这个公式进行变化,可以生成克里金插值法的不同类型。
首先,对于趋势值?(s),可以简单地赋予一个常量,即在任何位置s处?(s)=?,如果?是未知的,这便是普通克里金基本模型;?(s)也可表示为空间坐标的线性函数,如:
22 ?(s)??0??1x??2y??3x??4y??5xy (7)
如果趋势面方程中的回归系数是未知的,则形成泛克里金模型;如果在任何时候趋势已知的(如所有系数和协方差均已知),无论趋势常量与否,都会形成简单克里金模型。
其次,无论趋势如何复杂,?(s)仍无法获得很好的预测,在这种情况下需要对误差项
?(s)进行一些假设,即假设误差项?(s)的期望均值为0,且?(s)和?(s?h)之间的自相关
不取决于s点的位置,而取决于位移量h。为了确保自相关方程有解,必须允许某两点间自相关可以相等。
然后,可以对方程式左边Z(s)进行变换。例如,可以将其转换成指示变量,即如果Z(s)低于一定的阈值,则将其值转换为0,将高于阈值的部分转换为1,然后对高于阈值部分作出预测,基于此模型作出预测便形成了指示克里金模型。如果将指示值转变成含有变量的函数f(Z(s)),即形成析取克里金的指示函数。
最后,如果有多个变量的情况,则模型为:Zj(s)??j(s)??j(s),其中j表示第j个变量。除了为每个变量考虑不同的趋势?j(s)外,随机误差?j(s)之间还存在交叉相关性。这种基于多个变量的克里金模型即为协同克里金模型。
不同的方法有其适用的条件,当数据不服从正态分布时,若服从对数正态分布,则选用对数正态克里金;若不服从简单分布时,选用析取克里金;当数据存在主导趋势时,选用泛克里金;当只需要了解属性值是否超过某一阈值时,选用指示克里金;当同一事物的两种属性存在相关关系时,且一种属性不易获取时,选用协同克里金,借助另一属性实现该属性的空间插;当假设属性值的期望值为某一已知常数时,选用简单克里金;当假设属性值的期望值是未知的,选用普通克里金。 4 国外研究进展
从克里金方法被提出到现在已有完善的理论,并在很多领域得到了实际的应用,在某些