基于LSA和SVM的文本分类模型的研究
王永智;滕至阳;王鹏;聂江涛
【期刊名称】《计算机工程与设计》 【年(卷),期】2009(030)003
【摘要】为了提高文本分类的准确性,研究并设计了一个基于潜在语义分析和支持向量机的多类文本分类模型.利用潜在语义分析进行特征抽取,消除多义词和同义词在文本表示时造成的偏差,并实现文本向量的降维.使用具有良好分类精度和泛化能力的支持向量机进行分类,提出一种改进的一对一多类分类算法,改善不可分问题.实验结果表明,该模型在类别数目较少时具有较好的分类效果. 【总页数】4页(729-731,734)
【关键词】文本分类;潜在语义分析;支持向量机;特征抽取;一时一分类法 【作者】王永智;滕至阳;王鹏;聂江涛
【作者单位】东南大学,计算机科学与工程学院,江苏,南京,210096;东南大学,计算机科学与工程学院,江苏,南京,210096;东南大学,计算机科学与工程学院,江苏,南京,210096;东南大学,计算机科学与工程学院,江苏,南京,210096 【正文语种】中文 【中图分类】TP391.1 【相关文献】
1.基于潜在语义分析和HS-SVM的文本分类模型研究 [J], 张玉峰; 何超 2.基于潜在语义索引的SVM文本分类模型 [J], 郭武斌; 周宽久; 张世荣
3.基于文本分类和 SVM 的雷达侦察装备故障诊断研究 [J], 仝奇; 叶霞; 李俊山; 张仲敏
4.基于SVM与KNN的中文文本分类比较实证研究 [J], 刘怀亮; 张治国; 马志辉; 孙蕾
5.基于改进的SVM文本分类建模 [J], 刘秀松
以上内容为文献基本信息,获取文献全文请下载
基于LSA和SVM的文本分类模型的研究
基于LSA和SVM的文本分类模型的研究王永智;滕至阳;王鹏;聂江涛【期刊名称】《计算机工程与设计》【年(卷),期】2009(030)003【摘要】为了提高文本分类的准确性,研究并设计了一个基于潜在语义分析和支持向量机的多类文本分类模型.利用潜在语义分析进行特征抽取,消除多义词和同义词在文本表示时造成的偏差,并实现文本向量的降维.
推荐度:
点击下载文档文档为doc格式