Deep Web查询接口研究
钱 程,阳小兰
【摘 要】摘要:Deep Web查询接口是Web数据库的接口,其对于Deep Web数据库集成至关重要。本文根据网页表单的结构特征定义查询接口;针对非提交查询法,给出界定Deep Web查询接口的一些规则;提出提交查询法,根据链接属性的特点进行判断,找到包含查询接口的页面;采用决策树C4.5算法进行分类,并用Java语言实现Deep Web查询接口系统。 【期刊名称】计算机与现代化 【年(卷),期】2012(000)006 【总页数】5
【关键词】关键词:Deep Web;查询接口;表单
0 引言
随着WWW技术的飞速发展,Web中包含了海量的信息。Web可以分为Surface Web和Deep Web两大部分。Surface Web是指可以被搜索引擎索引到的页面的集合。而Deep Web一般指Web中不能被传统搜索引擎索引到的那部分页面集合,具体指Web中可访问的在线数据库,即Web数据库,其内容存储在真正的数据库中,这些内容只有在被查询时,才会由Web服务器动态生成,将其嵌入到页面中作为结果返回给访问者,没有超链接指向这些页面,无法被搜索引擎搜索到。Deep Web不仅蕴含了丰富的信息,而且大多数Deep Web面向某个特定的领域,信息更专业,非常有用[1-3]。
面对如此高效、有用的信息来源,如何自动地获取利用Deep Web中的信息并加以集成成为当前研究的热点之一。Web数据库的访问只能通过其提供的查询
Deep Web查询接口研究
DeepWeb查询接口研究钱程,阳小兰【摘要】摘要:DeepWeb查询接口是Web数据库的接口,其对于DeepWeb数据库集成至关重要。本文根据网页表单的结构特征定义查询接口;针对非提交查询法,给出界定DeepWeb查询接口的一些规则;提出提交查询法,根据链接属性的特点进行判断,找到包含查询接口的页面;采用决策树C4.
推荐度:
点击下载文档文档为doc格式