稀疏性SVDD方法在故障检测中的应用研究
王国柱1, 刘建昌1, 李 元2
【摘 要】摘 要: 在支持向量数据描述(SVDD)方法的基础上,通过研究原始正常数据分布在高维映射空间内的稀疏特性,选取前k个高维分布边缘的数据点进行SVDD建模,用于解决SVDD方法处理大样本数据的缺陷,以及建模与过程监视时间长的问题.经过理论推导和仿真分析,验证了稀疏性SVDD建模方法可以有效地提高建模以及过程检测速度;对于大样本数据可以利用筛选后的小样本进行建模,解决了SVDD方法不能很好地处理大样本数据分类的问题;同时,此方法不影响故障检测的精度.在TE过程中的应用验证了该方法的有效性.
【期刊名称】东北大学学报(自然科学版) 【年(卷),期】2015(036)006 【总页数】5
【关键词】关 键 词: 稀疏性;SVDD;稀疏性SVDD;故障检测
故障检测的实质可以用数据分类的问题来描述,通常数据可以分为正常(目标)样本与非正常(非目标)样本,在实际生产过程中,得到正常状态下的过程数据是很容易的,运用所获得的正常数据来对实时数据进行监视,是数据驱动故障检测的重要手段[1].SVDD方法是一种利用最小封闭球体与支持向量理论进行数据描述的方法,此方法与支持向量机类似,是一种针对小样本的学习理论[2-3],其主要思想是通过寻找数据集合最小边缘半径的超球体,使其能够尽可能包含所有的同类数据,排除非同类数据,达到数据合理分类的目的.该方法是一种新的单值分类方法,可以运用于工业过程故障检测.因此,可以利用正常数据建立
SVDD模型,求取模型控制限并对新的过程采样进行检测,实现过程监视的目的.
本文在SVDD算法的基础上,提出一种稀疏性SVDD(S-SVDD)建模方法,用于解决前者不能较好地处理大样本数据缺陷的问题.经过理论推导与仿真实验,验证了此方法可以有效地应用于工业过程故障检测.
1 SVDD方法与稀疏性理论介绍
SVDD理论上要求一个包含所有目标数据的尽可能小的球体,与SVM[4]类似,这个球体由少部分支持向量决定.对于一个有限数据集,支持向量是位于高维数据分布边缘的少量样本,SVDD[3,5]根据结构风险最小化原理,通过求取一个尽可能少的包含奇异点数据,并且体积最小的球体来描述样本数据,即求满足一定条件的半径为R和球心为a的球体.此方法适用于处理非线性与非高斯数据[6].
1.1 支持向量数据描述(SVDD)
为建立一个非线性数据模型,SVDD方法首先通过一个非线性变换R:x→F将原始正常数据X={xi∈Rd,i=1,2,…,n}映射到一个高维特征空间;其次,在特征空间中寻找一个最小体积的球体并使其包含所有的高维空间数据点.SVDD求取最小超球体的实质就是求解以下最优化问题[1]: .
s.t.‖R(xi)-a‖2≤R2+ξi,?i,ξi≥0 . (1)
其中:a是球心;C是控制球体体积和误差的折中常数;ξi为允许范围误差的松弛变量.可以将式(1)的最小化问题转化为其对偶问题的最大化问题[1]:
. . (2)
在式(2)中,内积可以用高斯核函数[7]来代替求解: (3)
将式(3)代入式(2),可以得到 . . (4)
根据上面分析求取使L最小值情况下的最优解αi,可以表现为以下三种情况(xsv为支持向量): (5)
当αi=0,数据点在球体内;当αi=C,数据点在球体外;当0<αi 超球体的球心a与半径R分别为[8-9] , . (6) 对于新采样的无故障数据只需满足以下条件: . (7)