表面增强拉曼光谱数据处理方法研究
拉曼光谱作为一种快速、无损、检测限制小而选择性高的分子散射光谱,可以对有机物、无机物以及掺杂体系混合物等实现精准的检测分析。但由于物质分子的拉曼散射面较小,故拉曼光谱强度很是微弱,加大了光谱检测与分析的难度。表面增强拉曼光谱(Surface Enhanced Raman Scattering,SERS)采用经特殊制备的表面粗糙金属或溶胶作为活性基底,可使表征物质结构信息的拉曼光谱获得1061015倍的增强,拥有超高的检测灵敏度。近年来,SERS在生物医学、食品安全、环境保护、材料分析等众多领域得到广泛应用,尤其在痕量检测方面,甚至达到了单分子分析水平。
然而,由于SERS测量仪器与技术本身的问题,测得的原始光谱包含有大量噪声、荧光背景和其它组分的干扰信息;且SERS数据量庞大,冗余严重,这严重影响了光谱分析模型的稳定性与可靠性。因此,如何快速、准确地从复杂原始光谱中最大限度的去除干扰、提取有效信息,是SERS光谱数据处理技术要解决的关键问题。针对SERS光谱普遍存在的荧光背景严重干扰光谱解析的问题,本文提出了一种基于迭代非对称加权惩罚最小二乘的IAWPLS算法,该方法使用softsign函数引入局部对称加权的思想,并通过迭代调整估计基线的权重,避免了现有基线校正方法中常见的估计基线偏低、校正后光谱抬升的现象。实验结果表明,IAWPLS方法不仅能够对不同基线类型的SERS光谱进行基线校正,并且与其它基线校正方法相比,在准确度、稳定性和便捷性上具有明显优势。
此外,校正后光谱的聚集度得到显著提升,说明该方法在去除背景信号干扰的同时,能有效地保留SERS的谱峰信息。针对SERS光谱数据维数高、且包含较多冗余使得光谱分析效率低、模型准确性和稳健性差的问题,本文研究了光谱特征提取方法,将连续投影算法用于SERS光谱波数间隔的提取,得到区间选择的连续投影算法,改善了单一波数提取容易造成重要特征信息的缺失问题。使用不同的区间长度对4-MBA、R6G与BSA三类SERS混合光谱和4-MBA、4-MBY两类相似SERS混合光谱分别进行波数提取,然后构建了PCA-LDA、PLS-DA、SIMCA和KNN四种分类器进行分类判别。实验结果表明,该方法在保持较高分类准确率的同时,简化了分类模型,提升了模型的计算效率,对于SERS光谱的在线分析具有重要意义。