数据库新技术介绍
一、数据库技术简介
数据库技术产生于20世纪60年代末70年代初,是通过研究数据库的结构、存储、设计、管理以及应用的基本理论和实现方法,并利用这些理论来实现对数据库中的数据进行处理、分析和理解的技术,是发展最快、活跃的IT技术之一。
数据库技术研究和管理的对象是数据,所涉及的具体内容主要包括:通过对数据的统一组织和管理,按照指定的结构建立相应的数据库和数据仓库;利用数据库管理系统和数据挖掘系统设计出能够实现对数据库中的数据进行添加、修改、删除、处理、分析、理解、报表和打印等多种功能的数据管理和数据挖掘应用系统;并利用应用管理系统最终实现对数据的处理、分析和理解等。数据库技术研究和解决了计算机信息处理过程中大量数据有效地组织和存储的问题,在数据库系统中减少数据存储冗余、实现数据共享、保障数据安全以及高效地检索数据和处理数据。
在数据库技术发展的四十多年里,各种学科与数据库技术有机结合,使数据库领域中新内容、新应用、新技术层出不穷,形成了各种各样的数据库新技术,如,多媒体数据库系统、基于对象的数据库系统、分布式数据库系统、知识数据库系统、模糊数据库系统、并行数据库系统、工程数据库、演绎数据库、时态数据库、统计数据库、空间数据库、科学数据库、文献数据库等。本文选择一些有代表性的数据库新技术,简单介绍各技术的基本概念、关键技术、相关应用等。 二、较常用的数据库新技术概述
(一)多媒体数据库技术
多媒体数据库是实现对格式化和非格式化的多媒体数据的存储、管理和查询的新型数据库。
1、多媒体数据库的特点:
(1)数据量大。多媒体数据量一般都很庞大,虽然采取了数据压缩,但压缩后的数据仍然很大。(2)非结构化数据。声音、图像、影视等数据基本上都是二进制串。这些数据从本身看不出任何结构,因此称为非结构化数据。媒体数据如果不另加一些描述、解释不是数据本身,而是关于数据的数据,即元数据。(3)等时性。多媒体数据中的连续数据在演播时须按一定的稳定速率传输数据;
在播演电视剧时,没帧必须按时、按序到达,不得前后抖动等。(4)特殊的用户接口及操作。对于声音、影视数据,除了需提供一般数据都有的增加、删除、修改和查询等操作外,还须提供与媒体有关的接口操作。
2、与传统数据库的区别:
(1)处理的数据对象、数据类型、数据结构、数据模型和应用对象都不同,处理方式也不同。(2)多媒体数据库存储和处理复杂对象,其存储技术需要增加新的处理功能,如数据压缩和解压。(3)多媒体数据库面向应用,没有单一的数据模型适应所有情况,随应用领域和对象而建立相应的数据模型。(4)多媒体数据库强调媒体独立性,用户应最大限度地忽略各媒体间的差别而实现对多种媒体数据的管理和操作。(5)多媒体数据库强调对象的物理表现和交互方式,强调终端用户界面的灵活性和多样性。(6)多媒体数据库具有更强的对象访问手段,比如特征访问、浏览访问、近似性查询等。
(二)面向对象的数据库技术
面向对象数据库系统是为了满足新的数据库应用需要而产生的新一代数据库系统,是一种新的程序设计方法学。把面向对象的方法和数据库技术结合起来可以使数据库系统的分析、设计最大程度地与人们对客观世界的认识相一致。
面向对象的数据库的特点:(1)容易维护。可读性高且方便低成本。(2)效率高。在软件开发时,根据设计的需要对现实世界的事物进行抽象、产生。使用这样的方法解决问题,接近于日常生活和自然的思考方式,势必提高软件开发的效率和质量。(3)易扩展。由于继承、封装、多态的特性,自然设计出高内聚、低耦合的系统结构,使得系统更灵活、更容易扩展,而且成本较低。
面向对象数据库研究的另一个进展是在现有关系数据库中加入许多纯面向对象数据库的功能。在商业应用中对关系模型的面向对象扩展着重于性能优化,处理各种环境的对象的物理表示的优化和增加SQL模型以赋予面向对象特征
(三)分布式数据库技术
分布式数据库是指:数据物理上被存放在网络的多个节点上,逻辑上是一个整体。其拥有3种模式:存储模式、逻辑模式、用户模式。
1、分布式数据库特点:
(1)在分布式数据库系统里不强调集中控制概念,它具有一个以全局数据
库管理员为基础的分层控制结构,但是每个局部数据库管理员都具有高度的自主权。(2)在分布式数据库系统中数据独立性概念也同样重要,然而增加了一个新的概念,就是分布式透明性。所谓分布式透明性就是在编写程序时好象数据没有被分布一样,因此把数据进行转移不会影响程序的正确性。但程序的执行速度会有所降低。(3)集中式数据库系统不同,数据冗余在分布式系统中被看作是所需要的特性,其原因在于:首先,如果在需要的节点复制数据,则可以提高局部的应用性。其次,当某节点发生故障时,可以操作其它节点上的复制数据,因此这可以增加系统的有效性。当然,在分布式系统中对最佳冗余度的评价是很复杂的。
2、分布式数据库的优势:
(1)它可以解决组织机构分散而数据需要相互联系的问题。比如银行系统,总行与各分行处于不同的城市或城市中的各个地区,在业务上它们需要处理各自的数据,也需要彼此之间的交换和处理,这就需要分布式的系统。(2)如果一个组织机构需要增加新的相对自主的组织单位来扩充机构,则分布式数据库系统可以在对当前机构影响最小的情况下进行扩充。(3)均衡负载的需要。数据的分解采用使局部应用达到最大,这使得各处理机之间的相互干扰降到最低。负载在各处理机之间分担,可以避免临界瓶颈。(4)当现有机构中已存在几个数据库系统,而且实现全局应用的必要性增加时,就可以由这些数据库自下而上构成分布式数据库系统。(5)相等规模的分布式数据库系统在出现故障的几率上不会比集中式数据库系统低,但由于其故障的影响仅限于局部数据应用,因此就整个系统来讲它的可靠性是比较高的。
(四)主动数据库技术
传统的数据库是被动的,数据的创建、检索、修改只有在用户或应用程序显式地提交命令后才被执行。但是显示应用中存在着各种各样的主动需求,系统要能自动的监视数据库的状态及变迁,主动数据库因此产生。
主动数据库与传统的数据库的区别:(1)冗错性:例外或错误的主动处理和自动恢复功能。当应用软件运行过程中产生例外或错误时,它不但仅仅有报警功能,而且应有主动地处理乃至自动恢复的能力,以使系统具有一定的冗错功能。特别是对一些需要快速反应而人工干预来不及的武器系统应用尤为突出。(2)
数据库新技术的介绍



