好文档 - 专业文书写作范文服务资料分享网站

一种混合特征选择方法及应用研究

天下 分享 时间: 加入收藏 我要投稿 点赞

一种混合特征选择方法及应用研究

赵学华,刘学艳,杨欣斌,湛邵斌

【摘 要】针对目前基于机器视觉的棉花异性纤维在线检测的分类精度低和检测速度慢的问题,提出一种高效的棉花异性纤维混合特征选择方法。首先利用费舍尔评分滤波式特征选择方法过滤噪声特征,然后利用蚁群优化从已去噪的特征集中选取最优特征子集。提出的方法与费舍尔评分方法及基于蚁群优化的特征选择方法进行了对比分析,结果表明提出的方法选出的最优特征集仅包含12个特征,分类准确度达到93.45%,对一幅4000×500像素的彩色图像的在线检测时间仅为0.8116秒。所提方法能选择出具有较高分类精度、较小特征数量的优化特征子集,可以有效地改进棉花异性纤维检测的精度与效率,对提高现有基于机器视觉的棉花异性纤维在线检测设备性能具有重要的应用价值。 【期刊名称】深圳信息职业技术学院学报 【年(卷),期】2016(014)003 【总页数】8

【关键词】棉花异性纤维;混合特征选择;费舍尔评分;蚁群优化

我国是世界棉纺织行业大国,在世界棉纺织行业占有重要的地位。对于棉纺织产品,棉纤维是其主要原料,然而,在棉花采摘和运输过程通常会混入非棉纤维,如发、羽毛、塑料布等,即通常所称的棉花异性纤维。棉花异性纤维是影响棉产品质量的主要因素,其在皮棉中的含量虽然很少,但却严重影响棉纺织品的质量[1]。因此,对于棉纺企业而言,有效地检测棉花异性纤维,不仅能提高棉纺织品质量也能提高棉纺企业的经济效益[2]。现今,基于分光技术的检测方法和基于机器视觉的检测方法是两类最重要的检测方法[1]。相比前者,基于

机器视觉的方法因可准确地检测棉层表面的杂质[3]而受到广泛的关注[4-8]。对于这类检测方法,需要基于棉花异性纤维图像提取的特征集训练分类器并进行预测,所以高分辨力的特征集是决定其性能优劣的关键因素[9]。目前,通过棉花异性纤维图像可提取大量的特征,如颜色特征、形状特征及纹理特征。采用所有特征构建特征集是一种可行的方法,但可能因大量冗余特征的存在而降低其分类性能。同时,过多的特征会增加计算时间进而影响在线检测的效率[9]。为提高棉花异性纤维的检测效率,需要构建具有高鉴别力的小尺寸特征集。特征选择是数据处理领域中一种有效的数据降维,提高预测性能的方法,可以帮助获取高质量的棉花异性纤维特征集[10]。目前,特征选择方法主要分为两类,一是滤波式(Filter)方法,该类方法独立于具体模型,当选出的特征集与具体分类模型结合时通常分类准确度较低;二是捆绑式(Wrapper)方法,该类方法需要与具体模型相结合进行特征选择,选出的特征集通常具有较高的分类准确率,但难以处理高维特征集。目前,基于群智能的捆绑式方法已应用到棉花异性纤维检测领域,如,基于遗传算法的特征选择方法、基于粒子群优化的特征选择方法及基于蚁群优化的特征选择方法等[9,11]。

为了获取具有高分类能力的棉花异性纤维特征集,本文提出一种混合特征选择方法(Hybrid feature selection,简称HFS),该方法结合滤波式方法及捆绑式方法的优点,实现高效的棉花异性纤维特征选择。HFS首先利用费舍尔评分(Fisher score,简称Fscore)去除噪音特征,然后利用蚁群优化(Ant colony optimization,简称ACO) 选取与具体分类模型相关的高鉴别力特征集,最终获取由少量特征组成的具有较高分类性能的优秀特征集,进而有效提高棉花异性纤维的检测效率。

1 混合特征选择方法

特征选择方法依据是否与具体模型相结合主要分为两类滤波式特征选择方法与捆绑式特征选择方法。滤波式特征选择方法主要根据特征间的相关性对每个特征进行评分,然后基于评分多少对特征进行排序,选取排序较高的特征作为最终的特征集。滤波式特征选择方法能有效处理高维数据且选取的特征集与具体模型无关。由于选择特征时,滤波式方法未考虑与分类模型间的相关性,使得该类方法获取的特征集通常具有较低的分类准确度。不同于滤波式特征选择方法,捆绑式特征选择方法需要具体的模型对选取的特征集进行评估,并确定具有最优分类性能的特征集作为最终选择的特征组合。在此过程由于需要反复训练与测试模型,导致计算成本高昂。特别是面对高维数据时,计算成本随着特征的数量增加成指数级增长。这是这类方法的面临主要问题,但捆绑式特征选择方法,相比滤波式特征选择方法,其优点是考虑了特征集与模型的相关性和特征间的依赖性,使得选出的特征集在具体模型下具有较高的分类精度。 针对上述两种特征选择方式存在的不足,本文提出一种棉花异性纤维混合特征选择算法(Hybrid feature selection,HFS),用于选取具有高分类性能的棉花异性纤维特征集,以满足在线检测对时间和精度的要求。提出的算法整合了Fscore评分与ACO优化,其中Fscore评估每个特征,并依据其评分对特征进行排序,主要用于去除噪音特征和降低特征空间维数,ACO优化将特征选择与具体分类模型结合,寻找与分器模型最相关的特征集。HFS算法可以有效弥补滤波式特征选择方法和捆绑式特征选择方法的不足,获得具有优秀分类性能的小尺寸特征集。HFS算法具体可以描述为两个阶段:(1) Fscore方法通过对棉花异性纤维特征进行评分排序识别噪声特征,通过去除评分较低的特征实现降

一种混合特征选择方法及应用研究

一种混合特征选择方法及应用研究赵学华,刘学艳,杨欣斌,湛邵斌【摘要】针对目前基于机器视觉的棉花异性纤维在线检测的分类精度低和检测速度慢的问题,提出一种高效的棉花异性纤维混合特征选择方法。首先利用费舍尔评分滤波式特征选择方法过滤噪声特征,然后利用蚁群优化从已去噪的特征集中选取最优特征子集。提出的方法与费舍尔评分方法及基于蚁群优化的
推荐度:
点击下载文档文档为doc格式
2n7eq5i2jq9kfa2517te4mn0g1mmp000jo0
领取福利

微信扫码领取福利

微信扫码分享