可能精确的词或词组。提供的词组越精确,检索结果就越好。同时,应通过不同词组的检索,逐渐缩小搜索范围。
3. 分步细化逐步接近查询结果
如果想查找某一类信息但又找不到合适的关键词,可以使用分类式搜索逐步深化。搜狐网站的主页上将所有的信息分为新闻、体育、财经、IT、生活、健康、理财等30余类,然后再根据各个大类分为各个小类,如在“IT”中又以细分为“互联网、通信、科学”等。
4. 使用模糊查询和精确查询
模糊查询又称为智能查询。当我们输入一个关键词时,搜索引擎不但反馈了包括关键词的网址,同时也发来与关键词意义相近的内容。比如,在网站上
查找“网络经济”一词时,模糊查询会反馈回来包含了“网络经济论文”、“网络经济与社会发展”、“信息经济”等内容的网址。所反馈的网址的排列顺序一般是:完全符合关键词的信息在最前边,其次是相近的信息。一般的搜索引擎都有这一功能,只是模糊的程序不同。模糊查询没有特殊的方法,在文字框中输入关键词即可。
用逻辑条件限制这一功能允许我们一次输入多个关键词,各关键词之间的关系可以是“和”、“或”、“非”(“and”、“or”、“not”)或“+”、“–”、“,”等基本布尔操作符。各搜索引擎实现这种查询的方式不尽相同,可以通过各引擎的帮助页找到各自不同的方法。大多数搜索引擎提供了“帮助”栏目,介绍如何使用引擎,以及如何在搜索中输入布尔操作符的相应词法。图5-1是中国电子商务联盟的模糊检索及相关符号使用说明。
图5-1 中国电子商务联盟的模糊检索及相关符号使用说明 5.3 利用网络收集市场信息 5.3.1 利用网络收集市场需求信息
1. 专题讨论
专题讨论方式是借用新闻组(Newsgroup)、邮件列表(Mailing Lists)和网上论坛(或称电子公告牌,BBS)的形式进行的。
1) 新闻组(Newsgroup)
网络新闻组是一些有着共同爱好的因特网用户为了相互交换信息而组成的用户交流网(Usenet)。这些信息实际上就是网络用户针对某一主题向新闻服务器张贴的邮件。这些邮件又按不同的专题分类,每一类为一个专题组,通常称为新闻组(Newsgroup)。企业可以选择与自己所关心的问题相关的新闻组,如“可
视电话”,与潜在的客户展开讨论,了解用户的需求情况(如图5-2所示)。 图5-2 用户在SOHU商城上发表评论 2) 邮件列表(Mailing list)
邮件列表(Mailing list)是指建立在互联网或新闻组网络系统(Usenet)上的电子邮件地址的集合。利用这一邮件地址的集合,邮件列表的使用者可以方便地利用邮件列表软件将有关信息发送到所有订户的邮箱中。
按照邮件列表的开放程度,邮件列表可分为以下三类。
(1) 开放式邮件列表:任何感兴趣的用户都可以自由加入或订阅的邮件列表,邮件列表完全由邮件管理程序管理,类似于讨论组。
(2) 封闭式邮件列表:邮件列表不对公众开放,只有邮件列表里的成员才能发表信件。
(3) 管制式邮件列表:只有经过邮件列表管理者批准的信件才能发表,如产品信息发布、电子杂志等。
图5-4 人民网上的网上调查表和简明式调查问卷 图5-5 有奖网上调查 3. 综合性搜索引擎
1) Google搜索引擎
Google(.google3>)是世界上最优秀的支持多语种的搜索引擎之一,它是由美国斯坦福大学博士生Larry Page与Sergey Brin于1998年发明的。Google 公司1999年成立,2000年7月 替代Inktomi 成为Yahoo公司的搜索引擎。Google因具出色的搜索功能,1998年至今已经获得30多项业界大奖。Google是目前世界上最大的搜索引擎,拥有 80 多亿张网页和10亿多张图片的资源,界面可用
100 多种语言表达,检索结果所采用的语言达30多种。
Google采用新一代的Page Rank检索技术。该技术通过对超过50000万个变量和20亿个词汇组成的方程进行计算,能够对网页的重要性做出客观的评价。PageRank技术并不计算直接链接的数量,而是将从网页A指向网页 B 的链接解释为由网页A对网页B所投的一票。这样,PageRank会根据网页 B 所收到的投票数量来评估该页的重要性。在综合考虑整体重要性以及与特定查询的相关性之后,Google 可以将最相关、最可靠的搜索结果放在首位。
2006年,通过Google开发的新一代桌面搜索工具——Google Desktop 3,用户可以搜索存储在PC中的各种数据,包括文档、电子邮件和通信录等个人信息,还可以加入远程组织和查找信息。如果用户同意将数据存储在Google服务器中,他们就可以在家中、工作时甚至飞机上通过任意一台电脑正常使用这些数据。当然,这里还需要解决隐私权保护问题。
利用Google 可以进行网站、图像、新闻组、论坛和网页目录检索,也可以进行Flash文件、货币转换等特殊信息检索。图5-6显示了Google 检索的基本过程。
2) 百度中文搜索引擎
百度在线网络技术有限公司(//baidu)于1999年底成立于美国硅谷,是目前全球最优秀的中文信息检索与传递技术供应商。在中国所有提供搜索引擎的门户网站
中,超过80%以上都由百度提供搜索引擎技术支持。它的创建者是信息检索技术专家、超链分析专利的持有人李彦宏和有多年商界成功经验的徐勇博士。2005年5月20日,百度被《中国企业家》杂志评选为2005年度“最具成长性的新兴企业”, 2005年8月5日百度在纳斯达克正式上市。
百度搜索引擎拥有目前世界上最大的中文信息库,总量超过6亿张网页,每天完成6000多万次搜索,是中国因特网用户最常用的搜索引擎。图5-7显示了百度搜索引擎的体系结构。
百度搜索引擎由四部分组成:蜘蛛程序、监控程序、索引数据库和检索程序,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。
百度搜索引擎主要提供新闻、网页、贴吧、MP3、图片和网站的检索。除网页检索只提供关键词检索外,其他栏目都提供目录和关键词两种检索方法,使用起来非常方便。
随着手机使用功能的增强,百度开发了通过PDA 及智能手机进行搜索的功能。无论使用palm、wince还是smartphone智能手机或者任意一款支持上网浏览网页的手机,都可以通过访问 //pda.baidu,享用百度强大的无线搜索功能。
图5-7 百度搜索引擎体系结构 3) 慧聪行业搜索引擎
慧聪公司(//web.huicong)成立于1992年,是国内领先的商务资讯服务机构。2003年12月,慧职公司实现了在香港创业板上市,成为国内信息服务业首家上市公司。
慧聪搜索引擎通过其世界领先的文本分析及集合技术来进一步优化搜索结果,实现了人工智能和搜索引擎技术的完美结合。其搜索结果的提取不再依赖某一个评
价标准,而以用户的个性要求为准则,把基于关键词匹配改变为基于概念的搜索,把和用户需求有关的内容提炼并聚类,大大提高了检索精度。
行业搜索引擎是慧聪为商务人士开发的大型“专业”搜索引擎,其检索结果可按各类商业用途细分,并且能够按照行业进行专业筛选,将出售、求购、科技文献等内容单独体现于检索结果中。例如,在“出售泵”的信息中,可以精确查找应用于水工业/暖通/石油/机械/化工等行业的泵的产品信息,这将极大提高商务人士的检索命中率,使商人不再为数以十万计的检索结果而苦恼,提高行业人士搜索的专业性和精确性。
图5-8是慧聪的行业分类检索页面。 4) 新浪、搜狐、网易的分类搜索引擎
新浪、搜狐、网易是国内三大门户网站。这三个网站都建立了强大的分类搜索引擎,各自具有自己的特色。
新浪网搜索引擎是面向全球华人的网上资源查询系统,分类检索目前共有18大类目录,205个二级目录,一万多个细目和数十万个网站,是互联网上最大规模的中文搜索引擎之一。其网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。图5-9是新浪分类搜索引擎有关目录。
搜狐分类搜索引擎(//dir.sohu)收录中文网站达150多万个,每日页面浏览量超过800万次,每天收到2000多个网站登录请求。通过搜狐可以查找网站、网页、新闻、网址、软件、黄页等信息。搜狐的目录导航式搜索引擎完全由人工加工而成,相比机器人加工的搜索引擎来讲具有很高的精确性、系统性和科学性。分类专家层层细分类目,组织成庞大的树状类目体系。利用目录导航系统可以很方便地查找到一类相关信息。
网易分类搜索引擎(//search.163)目前使用新一代开放式目录管理系统(ODP)。在功能齐全的分布式编辑和管理系统的支持下,现有5000多位各界专