基于非下采样双树复轮廓波变换的小波纹理特征识别肺良
恶性结节CT图像
马 圆1,2,韩鸿毅3,孙燕北3,梁志刚4,郭秀花1,2*
【摘 要】[摘 要] 目的 观察基于非下采样双树复轮廓波变换(NSDTCT)的小波纹理特征在识别肺良恶性结节CT图像中的应用价值。方法 从肺结节患者的CT图像中分别提取基于NSDTCT和基于Contourlet变换的小波纹理参数,对高维纹理参数采用单因素分析、Lasso回归等方法进行降维。对降维后的纹理参数分别构建诊断良恶性肺结节的支持向量机分类诊断模型,绘制ROC曲线,比较2种方法的诊断效能。结果 采用NSDTCT方法,基于经Lasso降维且自变量数目较少的纹理参数构建的诊断模型分类效果最好,判断良恶性肺结节的准确率为98.37%,AUC为1.00;采用Contourlet变换方法,基于全部提取纹理参数构建的模型分类效果最好,诊断准确率为56.05%,AUC为0.73;2个模型的ROC曲线的AUC差异有统计学意义(Z=6.430,P<0.001)。结论 基于NSDTCT的纹理分析方法对判断良恶性肺结节的准确性较高。 【期刊名称】中国医学影像技术 【年(卷),期】2019(035)002 【总页数】5
【关键词】[关键词] 非下采样双树复轮廓波变换;肺肿瘤;支持向量机;体层摄影术,X线计算机 医学物理与工程学
[基金项目] 国家自然科学基金(81773542)、北京市教委科技计划重点项目(KZ201810025031)。
[修回日期]2018-09-20
肺癌是影响人类健康的重要疾病之一[1],患者5年生存率仅为17%[2],如能早期诊断、及时治疗,患者10年生存率可达92%[3]。目前医学图像诊断领域中的计算机辅助诊断技术不断发展,其中纹理分析技术在肺癌预测、分类、预后判断等方面均有重要价值[4-6]。纹理特征提取是通过对图像进行变换和分析,自图像中提取有效特征用于纹理的描述和分类的图像分析方法。目前的多尺度分析工具,如Contourlet变换,明显优于单一尺度的纹理分析方法,在图像纹理分析中应用较多[7],但Contourlet变换需要进行下采样和上采样操作,使其缺乏平移不变性,且具有频谱重叠,在图像处理中具有人造纹理的缺陷[8]。非下采样双树复轮廓波变换(nonsubsampled dual-tree complex contourlet transform, NSDTCT)方法具有高度方向选择性、平移不变性及各向异性,可准确描述图像的边缘细节以及纹理特征[9],目前在图像融合、去噪及检索中已有应用[9-11],但其在医学图像分析中的应用较少[12]。本研究采用NSDTCT方法对肺结节的CT图像进行变换,并提取其纹理特征,以构建肺良恶性结节诊断模型,并与基于二代小波变换(Contourlet变换)提取的纹理特征进行比较,观察NSDTCT纹理对分类诊断肺良恶性结节的价值。
1 资料与方法
1.1 资料来源 收集2007年12月—2010年1月于首都医科大学宣武医院接受治疗的458例肺结节患者的CT图像,男290例,女168例,年龄15~91岁,平均(54.5±18.4)岁;其中恶性肺结节213例,良性245例。纳入标准:①经病理证实或随访2年以上,获得最终诊断结果;②图像为DICOM格式;③结节大小为0.3~3.0 cm;④包含结节的CT图像数≥5幅。排除信息资料不完整,
或结节与周围组织粘连而难以分割者。
1.2 ROI分割 首先在影像科医师的指导下,于病变部位手工勾画ROI,尽量包含病变,共获得3 056个ROI,其中恶性ROI共1 809个,良性ROI共1 247个;采用区域增长法对ROI进行分割。具体步骤如下:先对欲行分割区域确定1个种子像素作为生长点,而后将周围邻域中与种子像素有相同或相似性质的像素合并到种子像素所在区域;将这些新像素作为新的种子点继续上述过程,无满足条件的像素,即完成了1个区域的生长。本研究以分割区域的中心点自动作为种子点进行区域增长,具体分割过程见图1。 1.3 纹理特征提取
1.3.1 NSDTCT NSDTCT由多分辨率分析的双树复小波变换(dual tree complex vavelet transform, DTCWT)和方向分析的非下采样方向滤波器(non-subsampled directional filter bank, NSDFB)两部分相结合而获得[13]。首先采用NSDTCT方法对图像进行二维DTCWT分解,得到双树结构子带,产生2个低频子带和6个高频子带,6个方向分别为±15°、±45°、±75°;再对每层6个不同方向的高频子带分别采用二维NSDFB操作,共生成96张子带图。分别从这96张子带图中提取纹理参数,对肺部CT图像的边缘细节及高维精细纹理特征信息进行描述。NSDTCT能更稀疏地表示原图像,以并行使用2个实离散小波变换的方法,将其分别作为DTCWT的实部和虚部,称为A树和B树。A树和B树的行列滤波器组分别为[h0(n),h1(n)]和[g0(n),g1(n)],见图2。
对同一组图像进行Contourlet变换(16个尺度、6个方向,共获得96个子带图像),并与NSDTCT变换后的结果进行比较。
1.3.2 纹理计算 采用区域增长法对CT图像中肺结节ROI进行分割后,对获取的ROI进行NSDTCT变换和Contourlet变换,对变换得到的每个子图分别提取23个纹理参数,具体如下:利用灰度直方图计算图像的总体纹理特征参数,包括均值、标准差、平滑度、三阶矩、一致性、熵;利用灰度共生矩阵提取图像的局部纹理特征,包括能量、灰度均值、逆差矩、熵、相关性、聚类趋势、对比度、同质度、方差、最大概率、和的均值、差的均值、和的熵、差的熵;利用邻域灰度差分矩提取图像的局部纹理特征,包括粗糙度、对比度和频度。 1.3.3 纹理特征降维 高维纹理特征数据包含大量冗余信息,降低学习算法的准确性,故需对高维纹理数据降维。本研究采用常用的降维方法——Lasso回归,其基本原理是在回归系数的绝对值之和小于1个常数的约束条件下,使残差平方和最小化,从而能够产生某些严格等于0的回归系数,得到可以解释的模型。本研究采用十折交叉验证的方法,以模型分类错误率作为期望最小化目标参量,对高维纹理参数进行降维。
1.4 统计学分析 采用SAS 9.4统计分析软件和R软件(https://www.r-project.org/)的“glmnet”工具包。以单因素分析和Lasso回归的方法对提取的纹理参数进行降维。采用Wilcoxon秩和检验比较肺良恶性结节间的差异,由此筛选出组间差异有统计学意义的纹理参数,从而实现参数降维。采用Lasso回归方法,分别根据最佳lambda值和1个标准差范围内得到的最简单模型所对应的lambda值的纹理参数进行降维。P<0.05为差异有统计学意义。 以病理结果为金标准,在提取的所有纹理参数及降维后的纹理参数中,随机抽取80%数据作为训练集,以R软件的“e1071”工具包建立支持向量机(support vector machine, SVM)良恶性肺结节分类诊断模型,并以所余20%
数据作为测试集对分类诊断模型进行测试。以R软件的“pROC”工具包绘制ROC曲线,评价诊断模型对肺良恶性结节的诊断效能;采用Delong检验对ROC曲线的AUC进行比较,P<0.05为差异有统计学意义。
2 结果
2.1 纹理参数降维 采用Lasso降维方法分别对NSDTCT纹理参数、Contourlet纹理参数进行筛选。本研究采用十折交叉验证的方法拟合模型。将错分率作为目标参量,通过交叉验证,获得目标函数的置信区间,见图3、4。图中2条虚线分别指示2个特殊的lambda值,根据这2个lambda值,得到降维后的纹理参数。
经NSDTCT变换提取纹理参数,共获得2 208个纹理参数,经单因素分析降维得到1 884个纹理参数,经Lasso降维2个特殊的lambda值分别得到124个纹理参数和697个纹理参数(图3)。经Contourlet变换提取纹理参数,共获得1 344个纹理参数,经单因素分析降维得到440个纹理参数,经Lasso降维2个特殊的lambda值,分别得到126个纹理参数和222个纹理参数(图4)。 2.2 SVM建模及分类效果评价 随机抽取80%数据作为训练集,其余20%作为测试集,最终训练集包含2 444个ROI数据,测试集包含612个。基于提取的全部纹理参数、经单因素分析降维和经Lasso降维2个特殊的lambda值对应的纹理参数,采用Gaussian核函数,分别对NSDTCT和Contourlet纹理参数建立4个SVM分类诊断模型,表示为NSDTCT 1~4和Contourlet 1~4,ROC曲线结果显示其对良恶性肺结节的诊断效能,见表1及图5、6。 经NSDTCT变换提取的纹理参数建立的诊断模型的分类诊断效果优于Contourlet纹理参数,其中NSDTCT 3模型,即经Lasso降维且自变量数目