文档编号 GRINM-RM-01 版本号 1.0
有色金属研究总院测试中心
实验室信息管理系统 应急方案
北京XX天地科技有限公司
20XX年11月
第 1 页 共 29 页
文档说明
本文档是有色金属研究总院测试中心LIMS项目应急预案。 文档控制
文档作者:XX
创建日期:20XX年11月 确认日期:
控制编码:GRINM-RM-01 当前版本:1.0 更改记录:
日期 20XX-11-11 文件归档:
归档编号 GRINM-RM-01
归档时间 发给用户时间 作者 XX 版本 1.0 更改参考 第 2 页 共 29 页
目 录
目 录 ..................................................................................................................................................................... 3 1.1. 目的 ........................................................................................................................................................ 4 1.2. 前提条件 ................................................................................................................................................ 4 2. 紧急情况的发现与应急方案的启动 ............................................................................................................. 4 2.1. 紧急情况的发现 .................................................................................................................................... 4 2.2. 应急方案的启动 .................................................................................................................................... 5
2.2.1. 启动的条件 .................................................................................................................................... 5
2.2.2. 应急启动的发布 ............................................................................................................................ 5 2.3. 各类实验室负责人 ................................................................................................................................ 5
3. 应急措施 ........................................................................................................................................................ 5 3.1. 生产服务器发生故障 ............................................................................................................................ 5 3.2. 实验室同步故障 .................................................................................................................................... 6 3.3. 网络故障 ................................................................................................................................................ 6 3.4. 数据库故障 ............................................................................................................................................ 6 4. 操作系统相关维护 ......................................................................................................................................... 8 4.1. 数据库安装与配置 ................................................................................................................................ 9 4.2. 数据库日志检查 .................................................................................................................................. 21 4.3. 性能优化与配置 .................................................................................................................................. 22 4.4. 数据库备份与恢复 .............................................................................................................................. 24 5. 数据库备份与恢复方案 ............................................................................................................................... 25 5.1. 备份方案 .............................................................................................................................................. 25 5.2. 恢复方案 .............................................................................................................................................. 28
第 3 页 共 29 页
总体介绍
1.1. 目的
有色院STARLIMS系统作为实验室信息方面的企业级管理系统,一旦因各种原因意外中断,对有色院其他的信息系统影响重大。本文档的目的在说明如何应对系统的意外中断以及如何在系统恢复后保证数据的完整性。另外讲明了STARLIMS系统的基本维护方式方法。本文主要涉及的问题如下:
? 一旦发现不能进行系统的正常操作,最终用户首先应该如何操作?
? 根据业务处理的连续性要求,在有色院实验室信息管理系统中断的情况下,如
何处理业务?
? 在有色院实验室信息管理系统恢复运行以后,最终用户应该如何操作以保证系
统中数据的准确和完整?
? 数据库应该如何进行日常维护与备份数据采用哪种策略?
1.2. 前提条件
本文档所述应急方案针对有色院实验室信息管理系统因意外原因不能被最终用户正常使用的情况,即有色院实验室信息管理系统服务器系统停机/中断或网络中断的情况,并且该情况持续超过业务连续性所允许的范围,如超过1个工作日,或者有色院实验室信息管理系统不能顺利地支持实验室管理业务,如不能完成实验室审核、同步等业务。同时,本方案也可作为计划停机情况下或意外情况持续不超过1个工作日时,给与最终用户作为参考。
2. 紧急情况的发现与应急方案的启动
2.1. 紧急情况的发现
有色院实验室信息管理系统最终用户在发现不能正常申请、提报实验室时,首先请求所属单位现场技术支持人员,由现场技术支持人员将问题进行分析整理后,直接将问题提报有色院实验室信息管理系统维护人员。有色院实验室信息管理系统维护人员在确认问题是由系统故障或者是外部环境故障所引发但又不能及时解决的前提下,应根据技
第 4 页 共 29 页
术支持人员提供的预计问题持续时间,提交启动应急申请。
2.2. 应急方案的启动
2.2.1.
启动的条件
1) 停电造成有色院实验室信息管理系统瘫痪超过4个小时;
2) 局域网的网络中断使有色院实验室信息管理系统瘫痪超过4个小时; 3) 有色院实验室信息管理系统应用出现故障,使系统停运超过4个小时; 4) 有色院测试中心STARLIMS系统应用出现故障,无法正常使用;
5) 大量的实验室提报、审批业务,超越了有色院实验室信息管理系统的工作负荷,
系统无法正常运行超过4小时。
6) 影响生产企业紧急提报实验室数据1小时以上;
2.2.2. 应急启动的发布
由实验室管理系统项目组根据故障现象确认系统是否需要进行入应急状态,并报实验室管理办公室,由测试所领导批准。
实验室管理办公室下达应急方案启动令,业务支持人员指导整体业务应急方案的工作部署,各相关部门无条件配合做好应急工作。各级管理组织从上到下协调一致确保系统恢复后及时和正确地将实验室补充录到系统中。
2.3. 各类实验室负责人
应急方案启动后,各类实验室由专人管理,负责协调与之相关实验室的各种情况处理。
3. 应急措施
本方案针对不同的情况,给出相应的应急措施,分述如下:
3.1. 生产服务器发生故障
当系统运行的环境出现崩溃时,如服务器宕机,首先应有有色院实验室信息管理系
第 5 页 共 29 页