*欧阳光明*创编 2021.03.07
计算机检索的步调和办法
欧阳光明(2021.03.07)
一、明确检索要求和检索目标
计算机检索的第一步准备工作是明确检索要求和检索目标。
明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索用度。这些要求对选择数据库、构造检索战略都是十分重要的。 确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。 二、课题阐发
1. 课题概念的阐发办法
阐发课题就是阐发出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而阐发概念之间的上、下、左、右关系。对新学科、交叉学科和边沿学科的课题,则要搞清楚这些概念之间的关系。概念阐发的结果应以概念组为单位的词或词组的形式列出,以便下一步制订检索战略时使用。 2. 隐含概念的阐发办法
有些课题的实质性内容往往很难从课题的名称上反应出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入阐发,
*欧阳光明*创编 2021.03.07
*欧阳光明*创编 2021.03.07
才干提炼出能够确切反应课题内容的检索概念。例如:\社会包管\包含\养老保险\、\失业保险\、\医疗保险\和\社会救济\等概念,如果要检索社会包管方面的文献,应该析出上述概念,才干包管文献的查全率。 3. 核心概念的选取
有些检索词中已经含有的某些概念,在概念阐发中应予以排除。例如:课题\公司劳动奖励、职工培训和养老保险制度管理的理论和实践\,如果把\劳动奖励\,\职工培训\,\养老保险\,\公司\,\制度\,\管理\六个概念全部组配起来,则会造成年夜量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,并且,劳动力管理必定是针对该三个方面而言的。因此,本课题只须采取\劳动力资源\和\管理\这两个实质概念即可。
为了提高文献的查准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除要考虑反应主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不合拼法的词,以避免漏检有关的文献。 三、检索词的扩展、选择和处理
目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念阐发的基础上列出与概念有关的词,从中做出选择,并利用截词等办法对检索词予以归并。 1.相同概念的检索词的扩展
扩展相同概念的检索词的办法一般有同义词办法、主题词表办法和
*欧阳光明*创编 2021.03.07
*欧阳光明*创编 2021.03.07
截词办法
(1) 同义词办法。在同一概念的规模内,从语言角度,选择不合的名称、不合的拼写办法和单单数形式。不合的名称包含学名和俗名、简称和全称,商品名和物质或产品名,事物的代码和事物的学名。不合的拼写办法,以英语为例,包含英式英语和美式英语的区别。
(2)截词办法。当某些检索词词干相同、词义相近,但词尾或词中间有变更时(大都英语单词的单单数变更和英美不合拼写形式),可以采取截词办法扩展检索词。这种办法要求在词干后使用截词符。截词符一般包含\和\两种。具体采取什么形式,各个系统都有明确的规定。例如:在DIALOG系统中,截词符号有无限截词算符 (\和有限截词 (\和\等多种,\有时还用做字符屏蔽符。 (3)主题词表办法。许大都据库都编有自己的主题词表。在数据库编有主题词表的情况下,应该尽量从词表中选择检索词。使用主题词表,不但可以使检索词更加规范,提高检索结果的准确性,并且可以从同族词中选取更多的上位词、下位词、相关词,使获得的检索结果更为理想。 2.检索词的选择和处理
运用上述办法获得的词,首先应加以选择,并且注意选用本专业通用的术语(应避免使用冷僻词和根据中文术语自译生造的词),然后以概念为单位,构成组面(facets)。例如:课题\工具方社会包管制度比较研究\的概念组面和检索词为:
概念组面1:\社会包管\概念组面2:\制度研究\
*欧阳光明*创编 2021.03.07