好文档 - 专业文书写作范文服务资料分享网站

一种基于预裁剪的不确定数据流频繁项集挖掘算法

天下 分享 时间: 加入收藏 我要投稿 点赞

一种基于预裁剪的不确定数据流频繁项集挖掘算法

马 力

【摘 要】摘 要:随着交通、网络流量监控等应用的涌现,不确定数据流频繁项集挖掘成为近年来的研究热点。通常在不确定数据流中,频繁项集所占的比例较小,导致挖掘中无效操作较多。基于这种情况,提出了一种基于预裁剪的不确定数据流频繁项集挖掘算法Prep-UF-Streaming;该算法,不仅能裁剪掉大部分非频繁项集,提高了算法的平均运行时间;而且能够检测到非频繁项集成为频繁项集的可能性,尽量不丢失频繁项集,从而尽可能地提高算法的性能。 【期刊名称】科学技术与工程 【年(卷),期】2016(016)023 【总页数】5

【关键词】不确定数据流 频繁项集 滑动窗口 【文献来源】

https://www.zhangqiaokeyan.com/academic-journal-cn_science-technology-

engineering_thesis/0201258243581.html

频繁项集挖掘是数据挖掘领域的重要研究内容。文献[1]中提到的Apriori、FP-growth和H-mine,以及Eclat[2]等算法是针对静态数据集频繁项集挖掘的经典算法。人们在此基础上做了许多优化和改进。随着数据流应用如交通流量监控、森林防火监控的大量涌现后,数据流上的频繁项集挖掘引起了人们的重视。人们提出了许多有效的算法,如FP-Stream[3]、Lossy Counting[4]、Moment[5]等。然而实际应用中的数据是不确定的,其原因复杂,如原始数据不准确、使用粗力度集合等[6],所以确定的数据流研究并不能完全解决实际问题。因此,不确定数据流上的频繁项集挖掘成为近来的研究热点,典型代表算

一种基于预裁剪的不确定数据流频繁项集挖掘算法

一种基于预裁剪的不确定数据流频繁项集挖掘算法马力【摘要】摘要:随着交通、网络流量监控等应用的涌现,不确定数据流频繁项集挖掘成为近年来的研究热点。通常在不确定数据流中,频繁项集所占的比例较小,导致挖掘中无效操作较多。基于这种情况,提出了一种基于预裁剪的不确定数据流频繁项集挖掘算法Prep-UF-Streaming;该算法,不仅
推荐度:
点击下载文档文档为doc格式
2w88w8fiq0565jb3urou8mpoj7ocb000zod
领取福利

微信扫码领取福利

微信扫码分享