主题1 信息的获取
一、信息及其特征 1、 信息的基本概念
“信息”一词通常是指数据、消息所包含的内容和意义。 信息的表现形式有多种,如:图片、声音、动作、表情、文字 2、 信息的基本特征
载体依附性:信息不能独立存在,必须依附于一定的载体 价值性:信息是有价值的,而且可以增值
时效性:信息反映事物某一特定时刻的状态 共享性:信息可被多个信息接受者接收且多次使用
信息还有不完全性、真伪性等特征。 二、信息技术及其发展简史 1、 信息技术:简称IT
一切与信息的获取、加工、表达、交流、管理和评价等有关的技术都称之为信息技术。 传感技术、通信技术、计算机技术和控制技术是信息技术的四大基本技术,其中现代计算机技术和通信技术是信息技术的两大支柱。 2、 信息技术的悠久历史
第一次、语言的使用;第二次、文字的创造;第三次、印刷术的发明;第四次、电报、电话、广播、电视的发明普及,第五次、计算机技术与现代通信技术的普及应用 3、 信息技术的发展趋势
(1)越来越友好的人机界面 虚拟现实技术 利用三维图形生成技术、多传感交互技术、以及高分辨显示技术,生成三维逼真的虚拟环境
如:3D游戏、电子宠物、三维全景图片、虚拟试验 语音技术 关键技术有自动语音识别技术(ASR)和语音合成技术(TTS) 语音识别技术(Automatic Speech Recognition)是指将人说话的语音信号转换为可被计算机识别的文字信息,从而识别说话人的语音指令以及文字内容的技术。
语音合成技术(Text to Speech)是指将文字信息转变为语音数据,以语音的方式播放出来的技术。 智能代理技术 主动根据人的需要完成某些特定的任务。在教育、娱乐、办公自动化、电子商务等诸多方面得到应用
(2)越来越个性化的功能设计
信息技术产品走向了个性化和集成化的发展方向
(3)越来越高的性能价格比
1
成本的降低和性能的提高。知道电脑的主要性能参数:cpu、硬盘、内存、显示器。 操作系统分系统软件和应用软件,软件系统的核心是(操作系统)
三、信息的获取过程 1、 信息来源的主要途径
(1)直接获取信息:参加社会生产劳动实践和参加各种科学实验等,观察自然界和社会的各种现象
(2)间接获取信息:人与人的沟通,查阅书刊资料、广播电视、影视资料、电子读物等获取的信息 2、 信息获取的一般过程
3、 信息获取的方法和工具
信息来源分类
(1)文献型信息源:报纸、期刊、公文、报表、图书、辞典、论文、专刊 (2)口头型信息源:通过交谈、聊天、授课、讨论等方式进行口头相传的信息 (3)电子型信息源:广播、电视、电话、因特网
(4)实物型信息源:运动会、动物园、销售市场、各类公共场所 信息获取的工具
(1)扫描仪扫描图片、印刷体文字,并能借助文字识别软件OCR自动识别文字。 (2)录音设备可采集音频信息。
(3)数码相机可采集图像信息部分相机还有摄像功能。 (4)数码摄像机可以采集视频和音频信息。
(5)计算机可以获取来自光盘、网络和数码设备的多种类型的信息。 四、网络信息的检索 1、 因特网的服务功能
(1)电子邮件E-mail:是最基本、最重要的服务功能,是最为便捷的全球通信工具之
一。
(2)文件传输FTP:通过文件传输协议可将不同计算机之间、不同操作系统间的文件进
行传递。
(3)远程登录TELNET:通过远程登录协议可将本地计算机作为远程计算机的终端进行
工作,充分共享网络资源。
(4)电子公告牌系统(BBS):主要进行信息的发布和讨论。 (5)信息浏览与检索(WWW):通过浏览器可浏览信息和检索信息。 (6)电子商务(EC):通过网络进行商务数据交换和开展商务活动。
2、 搜索引擎及其类型
2
搜索引擎指用于因特网信息查找的网络工具。按工作方式划分为:全文搜索引擎和目录搜索引擎。它们是因特网上常用的两类信息检索方式,都是综合信息检索工具。
由于目录索引类搜索引擎与全文搜索引擎检索有各自的优点和缺点,于是很多搜索网站都同时提供这两种类型的服务,例如Google、Yahoo等。 (1)全文搜索引擎(关键字搜索引擎)
原理:使用自动索引软件(搜索器,也称“网络机器人”或“网络蜘蛛”)来搜集和标记网页资源,并将这些资源存入数据库。当用户输入检索的关键词后,它在数据库中找出与该词匹配的记录,并按相关程度排序后显示出来。
特点:由自动索引软件生成数据库,所收录的网络资源范围广、速度快、更新及时。 缺点:缺乏人工干预,准确性差。 代表网站:Google、baidu。
全文搜索引擎又分为:拥有自己的检索程序和数据库的,如Google;租用其他搜索引擎数据库,按自定格式排列的,如Lycos。 (2)目录索引类搜索引擎(分类搜索引擎)
原理:一般采用人工方式采集和存储网络信息,依靠手工为每个网站确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。
特点:在查询信息时,事先可以没有特定的信息检索目标(关键词),通过浏览主题了解某一主题的相关资源。而且目录型搜索引擎的网页由人工精选,网页内容丰富、学术性较强。
缺点:数据库的规模相对较小,收录范围不够全面、更新周期较长,有时可能会造成链接失败。
代表网站:雅虎、搜狐、新浪、网易(实际上有些已经变化,课本还提及两种搜索方式都提供的有Google、新浪、搜狐等)。 (3)特色信息检索工具
例:MIDI Explorer(搜索MIDI文件)、图行天下(搜索图形文件)
(4)其他信息检索工具 例:FTP搜索引擎:早期的北大天网(现为天网) (5)元搜索引擎
一种搜索引擎一般适用于一项任务。为了获得较好的结果,需要为每一项任务选择恰当的搜索引擎或者把多个搜索引擎结合起来。
使用元搜索引擎,用户只需提交一次搜索请求,由元搜索引擎负责转换处理后,提交给预先选定的其他多个搜索引擎,同时检索多个数据库,并根据多个搜索引擎的检索结果进行二次加工,如对检索结果去重、排序和标明检索结果的来源等,输出给用户。
例: DOGPILE http://www.dogpile.com
元搜索引擎优点:能方便地检索多个搜索引擎,扩大检索范围,提高检索的全面性。 元搜索引擎缺点:
1、元搜索引擎出现的时间短,一些搜索引擎强大的检索功能还不能实现。
2、元搜索通常只使用简单、直接的搜索策略,一般只支持AND、OR、NOT等比较低级的通用搜索操作。
3
3、检索速度较慢。 (6)因特网信息检索发展趋势
1、多媒体信息检索
2、专业垂直搜索引擎(只面向某一特定的领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录与及时更新) 3、 信息的搜索与浏览 4、 信息下载与保存
5、 OutlookExpress(以下简称OE)的使用
电子信箱地址格式:用户名@网络服务器的主机名。例如,zhangsan@sina.com.cn。 电子邮件服务器:
邮件接收服务器:POP3服务器名。 邮件发送服务器:SMTP服务器名。
五、信息的甄别与评价的方法 1、从信息的来源的权威性进行判断:
①通过查看信息来源,判断信息中涉及的事物是否客观存在、构成信息的各个要素是否真实。 ②通过把获取的信息与同类信息进行比较,考察信息来源是否有权威性。
③鉴别信息所反映的问题是否发生、该事物是否存在,信息所反映的情况是否有偏颇之处。 2、从信息的价值取向进行判断:
社会角色的不同决定了对信息价值取向的多样性。每个人都只关心与自己有关的信息。(价值的相对性)
3、从信息的时效性进行判断:
对突发性或跃进性的事实,在第一时间里做的报道,具有很强的时效性;如天气预报 渐进式的事实,就在事实变动中找到一个最新、最近的时间点来判断时效性;
过去发生的事实,新近才发现或披露出来的,可通过说明自己得到信息的最新时间和来的办法加以弥补。
主题2 信息的加工与表达
一、
信息加工的方式
1、 信息加工的概念
信息加工是指通过判别、筛选、分类、排序、分析和研究等系列过程,使收集到的信息成为能够满足人们需要的信息。 2、 信息加工的基本方式
可分为手工和电子两大类:
A.手工处理技术特点是所需工具较少,方法灵活,使用方便,被广泛采用。 B.利用电子计算机进行信息加工。电子计算机运算速度快,存贮容量大。 3、 计算机信息加工的过程
选择合适的软件 —> 信息录入 —> 信息加工 —> 信息输出 —> 信息存储
4
4、 计算机信息加工的类型
基于程序设计的自动化信息加工、基于大众信息技术工具的人性化信息加工、基于人工智能技术的智能化信息加工 二、
文本信息的加工
1、 文字在计算机中的编码方式
输入码:区位码、拼音码、王码 机内码:ASCII、国标码(GB)、BIG5码。
冯·诺依曼计算机中指令和数据均以二进制形式存放在存储器中。
ASCII码:字符“d”的ASCII码为01100100,则“g”的ASCII码是(01100111)
字型码:点阵表示。每一个点用一个二进制位表示,值“0”表示没有笔形,值“1”表示有笔形。例如:16*16点阵表示一个汉字,这个汉字就需要16*16/8=32字节来存放。 2、 文字处理及排版 3、 图文混排
4、 文本信息的结构化和形象化表达
文本信息结构化和形象化的表达形式多种多样,如流程图、结构图、表格、项目、图形等,它们都有不同的适用范围,需要我们根据实际需要做出适当的选择。 5、 Word表格编辑
1) 选中表格后按“Delete”将清除所有单元格内容,按“Backspace”将删除表格。 2) 在Word表格中设计表头:“表格”菜单→“绘制斜线表头” 三、
表格信息的加工(Excel)
1、 创建表格及录入数据
1)输入文字数据时,默认以左对齐方式显示;输入数字数据时,默认以右对齐方式显示。 2)注意单元格地址的表示:列号+行号,如“A1”;
3)用“Ctrl+;”组合键可快速输入日期;“Ctrl+Shift+;”组合键可快速输入时间; 2、 数据的合并居中
选中要合并的单元格→单击常用工具栏中的 3、 公式和函数的使用
●公式:可在单元格中直接输入计算公式,以 = 号开始,如“=A1*A2”;
●函数:单击常用工具栏按钮(或者“插入”菜单→“函数”命令),选择函数名,选取计算范围
SUM 求和、AVERAGE求平均数、MAX求最大值、MIN求最小数、COUNT计数 4、 数据的筛选
●筛选功能是在工作表中只显示符合设定筛选条件的行,而隐藏其他行。
操作步骤:选中数据区→“数据”菜单→“筛选”命令→“自动筛选”子命令→单击指定字段右侧的下拉箭头→选择筛选条件或者自定义
5