Web结构挖掘中HITS算法改进的研究
范聪贤;徐汀荣;范强贤
【期刊名称】《微计算机信息》 【年(卷),期】2010(026)003
【摘要】随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为国内外研究的热点.基于Web结构挖掘中HITS算法只考虑页面之间的链接关系而忽视了页面的具体内容,在这种情况下容易出现主题偏离[1]现象,影响了搜索结果,为了抑制主题偏离现象,本文把超链接信息检索方法与页面内容相结合,提出了一种改进的算法.实验结果证明改进的算法较原算法具有较好的效果,有效的抑制了主题偏离现象,具有一定的实用价值. 【总页数】3页(160-162)
【关键词】Web数据挖掘;Web结构挖掘;HITS;Google 【作者】范聪贤;徐汀荣;范强贤
【作者单位】215006,江苏苏州,苏州大学计算机科学与技术学院;215006,江苏苏州,苏州大学计算机科学与技术学院;215006,江苏苏州,苏州大学计算机科学与技术学院
【正文语种】中文 【中图分类】TP311 【相关文献】
1.应用Web结构挖掘的PageRank算法的改进研究 [J], 范聪贤; 刘秋菊; 徐汀荣
2.Web结构挖掘算法的比较改进研究 [J], 张禹
3.Web结构挖掘的PageRank算法改进 [J], 吴春旭; 郭磊 4.改进Web结构挖掘算法 [C], 霍红卫; 江裕民
5.Web结构挖掘中的PageRank算法改进 [J], 钱杰; 张健; 高乐
以上内容为文献基本信息,获取文献全文请下载
Web结构挖掘中HITS算法改进的研究
Web结构挖掘中HITS算法改进的研究范聪贤;徐汀荣;范强贤【期刊名称】《微计算机信息》【年(卷),期】2010(026)003【摘要】随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为国内外研究的热点.基于Web结构挖掘中HITS算法只考虑页面之间的链接关系而忽视了页面的具体内容,在这
推荐度:
点击下载文档文档为doc格式