好文档 - 专业文书写作范文服务资料分享网站

联合区间高斯过程的近红外光谱波长选择方法及应用

天下 分享 时间: 加入收藏 我要投稿 点赞

联合区间高斯过程的近红外光谱波长选择方法及应用

徐 琛, 尹燕燕, 刘 飞*

【摘 要】针对近红外光谱应用, 提出了一种基于高斯过程(GP)模型的波长选择算法, 即联合区间高斯过程(synergy interval gaussian process, siGP)算法。 首先将全光谱区域划分为一系列无重复且间距相等的区间, 再选取最优的若干个区间联合建立GP模型, 由于GP模型具有非线性处理能力, 因此该方法可以减少非线性的影响。 以红曲菌固态发酵过程中过程参数水分含量和pH值的检测为例, 新算法对水分含量、 pH值的预测集相关系数(rp)分别为0.956 4和0.977 3, 预测均方根误差(RMSEP)分别为0.012 7和0.161 0, 参与建模的数据点由全谱的1 500个分别减少到225个、 375个, 在对独立样本的预测上, 表现出较好的精度。 与传统联合区间偏最小二乘(siPLS)波长选择算法对比, siGP算法预测效果更好: 对水分含量和pH值, rp在GP模型预测时提高了3.37%和3.51%, RMSEP在GP模型预测时提高了29.4%和34.8%。 表明siGP结合GP模型能够有效选择波长区间以及提高近红外模型的准确性, 对进一步实现近红外光谱技术在线检测具有参考价值。 【期刊名称】光谱学与光谱分析 【年(卷),期】2016(036)008 【总页数】5

【关键词】近红外光谱; 高斯过程模型; 联合区间高斯过程(siGP); 红曲菌; 水分含量; pH值

引 言

近年来, 近红外光谱技术(NIR)作为一个过程分析工具, 被广泛应用于石油、

环境、 食品、 医药、 工业等领域[1-4]。 与传统实验室分析方法相比, NIR具有高效、 快速、 无损、 无污染等特点。

建立NIR定量分析模型, 以往大多使用线性回归方法, 如主成分回归(PCR)、 偏最小二乘(PLS); 但由于光谱数据中, 不可避免的会出现非线性因素, 一些非线性建模方法被提出, 如人工神经网络(ANN)[5]、 最小二乘支持向量机(LS-SVM)[6]等。 波长选择是NIR建模中非常重要的步骤, 可以减少无效信息对NIR模型的影响, 降低模型复杂度。 目前, 被广泛应用的波长选择算法有遗传算法(GA)、 连续投影算法(SPA)、 无信息变量消除(UVE)、 间隔偏最小二乘(iPLS)等。

iPLS算法是将NIR模型建立在全光谱区域中最优的一个区间上, 但在全光谱区域, 有效的波长区间不止分布在一个区间, 因此联合区间(si)的思想被提出[7], 通过选取几个(通常是2, 3, 4)区间联合建立NIR模型。 在实际过程中, 过程参数与光谱数据之间常常具有一定的非线性, 因此, 为了提高模型精度, 须在波长选择时考虑非线性因素。

作为一种新的机器学习方法, 高斯过程(GP)模型可以处理复杂的非线性问题, 且泛化能力强[8-10]。 与ANN和LS-SVM相比, GP模型作为一种非参数概率模型, 在给出模型预测值的同时, 还可以给出预测值对模型的精度函数; GP模型的优化参数相对较少, 学习速度快, 而且更易收敛。 近几年, 国内外学者逐步重视这一研究热点, 并在一些领域得到了成功应用[11-12]。 将GP方法引入近红外光谱检测, 提出一种融合GP模型和联合区间策略的波长选择算法: 联合区间高斯过程(siGP)算法, 为近红外光谱技术建立定量分析模型, 在波长选择阶段, 提供了一种处理光谱非线性因素的新思路, 并应用

到红曲菌固态发酵过程参数水分含量和pH值的快速检测中。

1 siGP波长筛选原理及方法

1.1 GP算法描述

对于给定光谱数据样本集A={(xi, yi)}, i=1,…,n, xi∈Rd, yi∈R, n表示训练样本数, d表示输入向量维数。 对于一个新的样本输入x, 预测分布的均值和方差如式(1)所示 (1) (2)

其中, c(x)=[c(x,x1),…,c(x,xn)]T是训练样本和测试样本之间的协方差向量, C是训练样本之间的协方差矩阵, c(x,x)是测试样本自身的方差, y=[y1,y2,…,yn]T。

GP模型可以选择不同的协方差函数, 我们选择高斯协方差函数 (3)

其中, ν是控制协方差的量度, ωd为每个输入的测度权重。

对于式(1)和式(2)的中的未知参数和高斯噪声方差ν, ω1,…,ωD和高斯噪声方差, 令,ω1,…,ωD]。 在GP建模中, θ一般是通过极大似然估计得到, 似然函数为 (4)

为了得到最优的参数θ, 首先在合理范围内选择一个随机值, 再用共轭梯度法搜索得到一个最优的θ[12]。 确定参数θ之后, 对于测试样本x, 用式(1)和式(2)来估计均值和方差, 高斯过程的输出即为估计的均值。 1.2 siGP算法

联合区间高斯过程的近红外光谱波长选择方法及应用

联合区间高斯过程的近红外光谱波长选择方法及应用徐琛,尹燕燕,刘飞*【摘要】针对近红外光谱应用,提出了一种基于高斯过程(GP)模型的波长选择算法,即联合区间高斯过程(synergyintervalgaussianprocess,siGP)算法。首先将全光谱区域划分为一系列无重复且间距相等的区间,再选取最优的
推荐度:
点击下载文档文档为doc格式
53lp81781p6c4rp7oypx5gf8x599m300sw5
领取福利

微信扫码领取福利

微信扫码分享