医学信息检索 本科简答题 查准率和查全率是什么 文献分类根据文献内容、性质和加工情况可将文献区分为:零次文献、一次文献、二次文献、三次文献。
零次文献是未经出版发行或进入在社会交流的最原始的文件。如私人笔记、实验数据、观测记录。
一次文献指以作者本人的研究成果为依据而创作的经公开发表或出版的各种文献,习惯上称作原始文献,
如期刊论文、研究报告、专利说明书、会议论文等。 二次文献是对是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的系统的有序的产物,即所谓的检索工具。
检索工具书和网上检索引擎是典型的二次文献。 如目录、索引、文献数据、简介、文摘等检索工具.
三次文献是在一、二次文献的基础上,经过综合分析而编写出来的文献, 人们常把这类文献称为“情报研究”的成果, 如综述、、数据手册等。
综述研究类,专题述评、学科年度总结、进展报告2)参考工具类,百科全书年鉴、手册、词典、大全3)文献指南类,工具书目录、专科文献指南、索引于文献服务目录 11.零次文献
是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。 12.一次文献
指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。
问答题
1.简述信息、知识、文献的概念及其三者之间的关系。
1.答:信息:是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。
知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。 文献:记录有知识的一切载体
三者从概念范畴上看,信息大于知识大于文献,知识是信息的一部分,是理论化系统化的信息,文献是知识中记载下来的那部分。
2.文献按载体形式不同分为哪几种类型,并举例说明。 2.答:文献按载体形式的不同分为: 手写型文献,如甲骨文、金文 印刷型文献,如图书、期刊
缩微型文献,如缩微胶卷、缩微胶片
视听型文献,如录像带、录音带、科技电影 电子型文献,如数据库文献和网络文献
3.文献的级别及其相互关系。
3.答:文献按照加工程度不同分为零次、一次、二次和三次文献四种。
其中零次文献是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等;零次文献在作者的加工处理后公开出版进入社会流通领域就变成一次文献;根据一次文献的各种特征按照一定的规则和方法对其进行整理、加工、浓缩,后形成的文献就是二次文献;利用二次文献线索对大量的一次文献内容进行综合、分析、加工、提炼后形成的文献就是三次文献。
4.在计算机检索中,如何缩小检索范围?
4.答:在计算机检索中,缩小检索范围的方法包括: (1)增加用and连接的检索词,或用“二次检索” (2)用特定的副主题词进行限定
(3)用字段限定检索,如标题词检索、主题词检索、加权检索等
(4)进行文献类型、语种、重要期刊、临床核心期刊、年份等的限定检索 (5)进入更专指的分类范围内输词检索
5.获取文献全文的方法有哪些? 5.答:获取全文的方法包括: (1)检索网上全文数据库 (2)利用网上出版社、杂志
(3)利用图书馆馆藏目录(馆藏联合目录) (4)利用“网上全文传递服务” (5)向著者索取
6.常用的检索途径有哪些? 6.答:常用的检索途径包括:
主题途径、分类途径、关键词途径,著者途径、机构检索、题名途径、号码途径等
7.简述信息检索的原理
7.答:信息检索的原理是:将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。本质是用户的信息需求与存储在信息集合中的信息进行比较和选择, 即匹配的过程。
8.计算机检索通常包括哪些步骤? 8.答:信息检索的步骤包括:
(1)分析检索课题,明确目的和要求 (2)选择合适的检索工具
(3)选择检索途径,确定检索标识。 (4)查找文献线索。
(5)浏览检索结果,获取原始文献。
9. 简述IM主题索引的编排规则。 9.答:主题索引的排列规则如下
(1)整个索引按主题词字顺排
(2)同一主题词下按副主题词字顺排
(3)相关内容的文献题录分别纳入相应的主题词或者主题词/副主题词之下;一般总论性文献直接入主题词下,专指性文献入相应的副主题词下;同一文献题录可入多个主题词之下
(4)同一主题词或副主题词下的文献题录,先排列英文文献,后排列非英文文献,非英文文献的英译标题用\括起,以示区别 (5)英文文献按刊名缩写字顺排
(6)非英文文献先按文种缩写字顺排,同一文种下按刊名缩写字顺排。
10.《医学主题词表》(MeSH)字顺表的参照系统有哪几种?举例说明其意义。 10.答:第一组:用代参照,用于处理词与词间的等同关系。在MeSH词表中,对于多个同义词只采用其中一个比较科学而通用的词作规范化主题词,其它的词作为非主题词(即款目词)。用“款目词see主题词”和“主题词X款目词”表示。如:Cancer see Neoplasms Neoplasms X Cancer
第二组:属分参照,用于处理词与词之间的等级关系,即整体与部分,上位概念与下位概念之间的关系。如某些范畴较小的主题概念主题词,包含在某些范畴较大的主题词之下,内容范围较广的词是主题词,其下的内容范围较窄的词不作主题词,只作为次要主题词。用“次要主题词see under 主题词”和“主题词XU 次要主题词”表示。如:Health Priorities see under Health Planning Health Planning XU Health Priorities 从1991年开始取消此种参照关系,所有次要主题词升格为主题词。
第三组:相关参照,用于处理词间的相关关系,达到扩大检索,提高查全率的目的。用“主题词see related 主题词”和“主题词XR主题词”表示。如:Population Control see related Family Planning Family Planning XR Population Control 为提高查全率和方便检索,MeSH词表于1991年和1992年又先后增设了“还应考虑参照(consider also)”和“主题词/副主题词组配参照”。
11.按照存储内容的不同,数据库通常分为哪些类型?
11.答:书目数据库、事实数据库、数值数据库、全文数据库、图像数据库
12.什么叫主题词的扩展检索,它的优越性何在?
12.答:选择主题词的扩展功能可以同时检索主题词和它的所有下位词,这样就可检出用所选主题词和更专指主题词标引的所有文献,可以更好的提高检索的查全率。不扩展的情况下只会检出用所选主题词标引的文献,不会检出它的下位词,即那些更专指主题词标引的文献。
13.什么是查全率和查准率,二者之间有何关系?
13.答:查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。
查全率=【检出相关文献量/文献库内相关文献总量】×100%
查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。
查准率=【检出相关文献量/检出文献总量】×100%
查全率与查准率是呈互逆关系的。要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率。企图是查全率和查准率都同时提高,不是很容易的。强调一方面,忽视另一方面,也是不妥当的。应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果。
14.影响查全率和查准率的因素有哪些? 14.答:(1)影响查全率的因素
影响查全率的因素从文献存储上来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念和用词不当等。此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟悉和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。 (2)影响查准率的因素
影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所使用检索词专指度不够,检索面宽于检索要求;检索系统不具备逻辑“非”功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑“或”不当等。
15.独立型搜索引擎的工作原理是什么? 15.答:独立式搜索引擎的工作原理是:
定期运行搜索软件(或人工),搜集网络信息。 利用索引软件进行自动标引,建立数据库。
以Web页面形式向用户提供有关的信息资源导航、目录索引及检索界面,由用户输入检索式。
通过检索软件进行检索,匹配,按相关度排序输出。
16.如何提高检索的查全率? 16.答:提高查全率的方法:
(1)降低检索词的专指度,选出一些上位词和相关词补充到检索式中。 (2)调节检索式的网罗度,减少逻辑“与”的组配面。 (3)进行族性检索,可采用分类检索,或用一组同义词、近义词和相关词,用“或”连接在检索式中。
(4)采用截词技术,取消某些限制过严的限制符。
17.如何提高检索的查准率? 17.答:提高查准率的方法:
(1)提高检索词的专指度,换用专指度较强的规范词或自由词。 (2)增加“与”连接,进一步限定主题概念。
(3)限定检索词所在的可检字段,用位置算符控制检索词的词间顺序与位置。 (4)限制输出文献的外部特征,如限制年限、语种、文献类型等。 (5)用逻辑“非”限制与提问不相关的文献的输出。 (6)用主题词检索,不用或少用自由词检索。
18.依据我国专利法专利有哪几种类型 各种类型的专利有效期为多长?
18.答:依据专利法保护对象分三种类型:发明专利、实用新型专利、外观设计专利
发明专利,是专利法主要的保护对象。发明专利权有效期各国不同,我国为自申请之日起20年。
实用新型专利,在我国实用新型专利权有效期为自申请之日起10年。 外观设计专利,在我国外观设计专利权有效期为自申请之日起10年。
19.信息检索系统的基本要素是什么? 19.答:信息检索系统的构成包括:
(1)检索文档,即文献检索标识的有机集合。
(2)技术设备,即能存储信息及其标识,并实现存储和检索操作的各种技术设备。
(3)作用于系统的人如:文献加工者、用户、系统维护人员、管理人员。 (4)检索工具如:检索语言、文献标引规则、输入输出标准等。
20.何谓数据库的顺排文挡和倒排文挡?
20.答:顺序文档(Sequential file)是以文献记录作为信息存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档,由于它存储有关于每篇文献的最完整信息,所以通常又把它称为主文档(Master File),相当于印刷型检索工具的正文部分。倒排文档(Inverted file)就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档。倒排档从主文档中派生出来,所以,又叫做辅助文档。
21.获取网络信息资源的主要工具有哪些? 21.答:获取网络信息资源的主要工具包括: (1)电子邮件 (2)FTP (3)Archie (4)Telnet (5)Gopher (6)Usenet
(7)www浏览器 (8)搜索引擎
22. 核心期刊的主要特点是什么?
22.答:少数刊载某一学科大量高质量专业论文的期刊称为核心期刊,其主要特点为:
(1)刊载专业文献密度高,信息含量高;
(2)水平较高,代表本学科的最新发展水平; (3)出版相对稳定,所载文献寿命较长; (4)利用率和被引率较高。