信息资源管理马费成赖茂生考试重点
信息资源管理 马费成 赖茂生
信息:事物存在的方式和运动状态的表现形式。
信息:语法信息:仅考虑形式因素的信息。语义信息:考虑其中内在含义因素的信息。语用信息:考虑其中效用因素的信息。
信息资源:人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(设备、人员等)的集合。 经过加工处理有序化并大量积累起来的可利用的信息的集合。
信息源:信息的来源。文献信息源,非文献信息源。
1 一次信息源,本体论信息源 。2二次信息源,感知信息源,人大脑储藏。3三次信息源,再生信息源。口头、体语、文献、实物。4 四次信息源。集约信息源,文献信息源或实物信息源的集约化。
信息势:信息源可以累积信息,在它及吸收之间形成了信息位差。信息势的存在是信息流和信息交流活动产生的前提。
信息资源特征:一般特征:1、所为生产要素的人类需求性。2、稀缺性。3、使用方向的可选择性。
特殊性:1、共享性。2、时效性。3、生产和使用中不可分性。4不同一性(独特性)。5、驾驭性。6、累积性和再生性。
信息资源管理(IRM):管理者为达到预订的目标,运用现代化的管理手段和管理方法来研究信息资源在经济活动和其他活动中利用的规律,并依据这些规律对信息资源进行组织、规划、协调、配置和控制的活动。
2章信息资源管理中的内容管理
信息按 加工深度分:零次信息(未成为文献前的信息存在状态)、 一次信息(作者根据本人研究工作和成果撰写、发布的信息)、二次信息(对一次信息进行整理、加工、提炼和压缩得到的信息。)、三次信息(对一次、二次和其他三次信息的基础上,加工而成的信息)。一次、二次、三次,可以类同对文献进行划分
信息采集原则:1、系统性原则(系统、全面、完整)2 针对性(依任务和服务对象,有针对、有重点、有选择地采集)3及时性原则(及时、迅速地提供给它的使用者)4、可靠性(真实、准确、可靠)5 方便、经济性原则 6计划性原则(当前以及未来)7预见性(着眼现实,又要有超前性)
信息采集策略:
定向采集:在采集计划范围内,对某一科学、某一国别、某一特定信息尽可能全面系统地采集。
定题采集:根据用户指定的范围或需求有针对性地进行采集工作。定题服务。 单向采集:对特定用户的要求,只通过一条渠道,向一个信息源进行采集,针对性强。
多向采集:对特殊用户的特殊要求,广泛地多渠道地进行采集。成功率高,容易重复。
主动采集:针对需求或根据采集人员的预测,事先发挥主观能动性,赶在用户提出信息要求之前即着手采集工作。
跟踪采集:针对有关信息源进行动态监视和跟踪,这对深入研究跟踪对象很有益处。
建立信息网络:
信息资源管理马费成赖茂生考试重点
利用互联网进行信息采集 严格管理及激励措施结合 信息采集方式。
文献型 :1 购买2交换3接收4征集5申请6复制7网络搜索。 实物型:实地参加活动,参观实物、购买、索取等。 鲜活型:交谈、采访、社会调查等。
数据:实验、观察、检测、考察、统计等等。
新型采集技术:1全自动电话访谈(CATS)2交互式计算机辅助电话访谈(CATI)3电脑柜调研4网络调研系统
信息表示:有信源或通道机制(如编码者)提供的、关于他们如何相信该信息将适合于现有的某种组织化标识集合的一种陈述。
信息表示生成方法:派生法:信息表示直接来自对象信息信息集合自身,利用某些识别和分析技术,从对象信息集合中提取可用于信息组织和检索的语词符号或其他特征标识。
指派法:信息表示来自对象信息的外部,由信息加工处理者在对信息内容进行分析的基础上,考虑其潜在用户的知识结构,参考社会的公共知识结构,确定要揭示的信息内容的属性及表示方式,直至把标识赋予对象的过程。赋词标引法,包括受控词标引和自由词标引。
信息表示语言: 置标语言(Markup Language)、元数据 、信息检索语言 元数据:关于数据的有结构的数据描述,或者说,定义和描述其他数据的数据。
元数据分为三种基本类型。1知识描述型元数据。(用来描述、发现和鉴别数字化信息对象)。2结构型元数据。(用来描述数字化信息资源的内部结构)3存取控制型元数据。(用来描述数字化信息资源能够被利用的基本条件和期限,以及其知识产权特征和使用权限)
元数据格式:1内容,元数据格式的构成元素及其定义。2句法结构,定义元数据结构以及如何描述这种结构。3语义结构,定义元数据的具体描述方法。
都柏林核心集(DC)三大类(1描述资源内容的要数。2描述知识产权的要数。3描述资源外部属性的要数)十五个要素。
DC优点:1鼓励作者和出版者以自动资源发现工具能收集的形式提供元数据。2鼓励包含有元数据模块的网络出版物工具的创造。3、DC生成的记录能作为更详细的编目记录的基础。
信息检索语言:用于信息内容表示、存储和检索等过程的语言,或者是上述语言及给定检索软件中所特有的命令的组合。分自然语言和受控语言。
三种功能1、信息表示功能。2信息/知识组织功能。3、词汇控制和协调功能。
分类法:等级列举式分类法(依据学科门类来列类,用于藏书组织和分类目录编制)和分面分类法(按主题来列类,经过描述对象的概念的分析及综合,可以把复杂主题概念分析为若干简单的主题概念或概念因素,简单的主题概念可以综合表达复杂的主题。适用于编制分类目录或索引)
信息资源管理马费成赖茂生考试重点
主题标引简称标引,对文献的内容主题及其他有检索意义的特征进行分析、识别、提炼和归纳,然后用某种检索语言标写出来,作为信息存储及检索的依据的信息处理过程。赋予文献检索标识,指明其内容特征。
标引方法:标题词法,元词法,叙词法,自动标引(抽词标引和赋词标引) 标引质量衡量指标:标引网络度、标引专指度、标引一致性 信息检索分:文献检索、事实检索、数据检索
检索:1、用户需求分析。2、检索策略制定(为实现检索目标而制定的全盘计划和方案)。3、实施检索。 检索技术有布尔逻辑检索、截词检索、限制检索、位置检索、加权检索、多媒体检索(基于描述和基于内容两种)、超文本检索。
信息分析:将信息转化为某一特定类型的知识,为某个用户提供决策时所需要的东西。
内容分析:识别某一信息的属性或特征,以达到准确推出该信息源的意义的过程。通常用的技术有:词频和相对频率分析技术、停用词表技术、语词轮排和对照技术、基于受控词表的分析方法、词干分析技术、定义语法类、句法分析法、结构分析法等。
情报分析:对一个特定领域的大量信息进行采集、选择、评价、分析和综合,或者为了某一特定任务对相关信息进行收集、分析和综合,使之成为对解决相关问题有用的情报的过程。五步:选题、开题报告的审查论证、信息收集和整理、分析研究、研究报告撰写。
数据挖掘:对数据库(数据仓库)中蕴涵的、未知的、非平凡的、有潜在应用价值的知识的提取,有称为数据库中的知识发现。得到的信息知识具有隐含、事先未知、潜在有用三个特征。
数据挖掘任务:从大量数据中发现尚未被发现的知识,从系统内部自动获取知识的过程。
数据挖掘功能:1概念描述2关联规则发现3分类规则的发现4聚类5回归模式分析6序列模式分析7时间序列模式8偏差分析
信息资源开发利用:根据社会需要,对信息资源进行采集、处理、存储、传播、服务、交换、共享和应用的过程。
信息资源开发意义:1信息是主要的生产要素。2信息促进经济变革和发展的强大动力。3信息资源开发利用能力是核心竞争力的重要体现。4完善市场经济的重要手段。5提高政府运作效率的需要。6实现可持续发展的需要。
信息资源开发利用的原则:1统筹协调。2需求导向。3创新开放。4确保安全。
借鉴国外:1政府目标明确、责任清楚。2政府有所为,有所不为。
信息资源开发利用的三层次模式:第一层基础性信息资源开发,其重点是编制信息资源目录和建设若干个国家或地区性的基础信息资源库。第二层开发建设各种综合性和专业性的数据库。第三层建设各种信息应用系统。
关键技术:信息采集技术、信息组织技术、信息检索技术、信息共享平台技术、信息安全技术。
第3章