一种高效的Web新闻发表时间提取方法
仲兆满;李存华;乔磊;张文艳;管燕
【期刊名称】《小型微型计算机系统》 【年(卷),期】2013(034)009
【摘要】Web网页的发表时间在Web搜索中起到重要的作用,因为用户获取的结果往往是与时间密切相关的.本文围绕Web新闻发表时间的提取,提出了一种高效的Web新闻发表时间提取方法.该方法考虑到了Web新闻网页URL地址隐含时间信息的特性,信息发表时间与新闻标题的距离约束.在主流的7个中文搜索引擎,使用了30个关键字,共获取3827篇Web新闻信息进行了提取时间的准确率及时间消耗的实验分析与比较,结果显示本文提出方法的准确率为95.5%,时间消耗为88秒.
【总页数】5页(2085-2089)
【关键词】信息抽取;发表时间抽取;Web新闻;高效方法 【作者】仲兆满;李存华;乔磊;张文艳;管燕
【作者单位】淮海工学院计算机工程学院,江苏连云港222005;淮海工学院计算机工程学院,江苏连云港222005;淮海工学院计算机工程学院,江苏连云港222005;中国矿业大学计算机科学与技术学院,江苏徐州221116;淮海工学院计算机工程学院,江苏连云港222005;中国矿业大学计算机科学与技术学院,江苏徐州221116;淮海工学院计算机工程学院,江苏连云港222005 【正文语种】中文 【中图分类】TP311 【相关文献】
1.一种基于领域本体的Deep Web实体信息提取的后处理方法 [J], 余伟; 陶皖 2.一种基于Web的新闻抽取方法 [J], 朱建华
3.一种基于噪音过滤包装器的Web新闻抽取方法 [J], 孙梦; 瞿有利
4.一种高效Web数据抽取包装器的设计与实现 [J], 李宏伟; 史培中; 张素智 5.一种基于视觉分块的Web信息抽取方法研究 [J], 耿焕同; 宋庆席; 何宏强
以上内容为文献基本信息,获取文献全文请下载
一种高效的Web新闻发表时间提取方法



