基于随机森林的正例与未标注学习
邵强;张阳;蔡晓妍
【期刊名称】《计算机工程与设计》 【年(卷),期】2014(000)012
【摘要】To use positive and unlabeled examples to train the classifier (PU learning) ,an algorithm based on the random forest was proposed .The PU decision tree algorithm POSC4.5 was extended to deal with the random feature selection when a tree was growing .In the training phrase ,sampling with replacement on the original PU dataset was adopted to generate multiple different PU training datasets and multiple trees were trained on these datasets using extended POSC4.5 .In the classification phrase ,the outputs of the trained trees were aggregated using the majority vote .Experimental results on UCI data sets show that the classi‐fication performance of the method proposed is better than that of the biased support vector machine ,the POSC4.5 and the bag‐ging POSC4.5 .%为使用正例与未标注数据训练分类器(positive and unlabeled learning , PU learning),提出基于随机森林的PU学习算法。对POSC4.5算法进行扩展,在其生成决策树的过程中加入随机特征选择;在训练阶段,使用有放回抽样技术对PU数据集抽样,生成多个不同的PU训练集,并以其训练扩展后的 POSC4.5算法,构造多棵决策树;在分类阶段,采用多数投票策略集成各决策树输出。在 UCI数据集上的实验结果表明,该算法的分类性能优于偏置支持向量机算法、POS4.5算法和基于装袋技
术的POSC4.5算法。 【总页数】6页(4329-4334)
【关键词】正例与未标注学习;决策树;随机森林;集成学习;偏置支持向量机 【作者】邵强;张阳;蔡晓妍
【作者单位】西北农林科技大学信息工程学院,陕西杨凌712100;西北农林科技大学信息工程学院,陕西杨凌712100;西北农林科技大学信息工程学院,陕西杨凌712100 【正文语种】中文 【中图分类】TP391 【文献来源】
https://www.zhangqiaokeyan.com/academic-journal-cn_computer-engineering-design_thesis/0201240870195.html 【相关文献】
1.基于随机森林的列车到站时间预测方法 [J], 袁志明; 张琦; 黄康; 冯姗姗 2.基于随机森林决策树质量管理方法研究 [J], 唐学华
3.基于随机森林的分类器在犯罪预测中的应用研究 [J], 孙菲菲; 曹卓; 肖晓雷 4.基于随机森林的乳腺肿瘤诊断研究 [J], 刘永春; 宋弘
5.基于多标签随机森林的电能质量复合扰动分类方法 [J], 瞿合祚; 刘恒; 李晓明; 黄建明
以上内容为文献基本信息,获取文献全文请下载