? 三级故障事件:网络或系统的操作性能受损,安全事件(例如病毒在小范围内发作),但大部分业务运作仍可正常工作; ? 四级故障事件:在网络、服务器、存储、安全设备功能、安装或配置方面需要调整或优化。本级故障事件对信息系统的业务运作几乎无影响,或影响很小。
依据事故重要性和紧急性的原则,每一级事故严格定义升级时间为2小时,其中在二级事故和一级事故应急处理过程中,要及时考虑替代恢复方案,尽可能在最短的时间内恢复业务系统。其中三级事故的处理,驻场服务人员在事故响应1个小时内,如果不能快速判断问题所在,可以寻求整个服务团队的支持。在一、二级事故判断中,服务人员在监控中发现问题,一方面应迅速将问题向部门领导进行反应,一方面须快速判断问题和收集事故信息,涉及到具体产品提供商或服务商内,及时告知客户协调相关厂商现场支持。为保障业务平台的正常运行,除对突发故障的应急支持外,要充分保障日常对业务系统软硬件的应急灾备恢复预案,并通过定期的演练加强应对突发事故的意识和流程。 4.5服务报告要求
维护团队定期提供服务报告,服务期结束前应提供服务年报,并对每一次重大故障和问题的原因、解决方法、完成情况等形成专门报告,及时报送用户部门和服务管理部门。在运维服务过程中将产生不限于以下的记录和报告:
? 日常维护报告
24
? 系统巡检日志 ? 系统维护记录 ? 系统优化记录 ? 各类优化的管理制度 ? 故障分析处理记录 ? 故障整改方案和建议 ? 交接班登记表 ? 重大故障记录报告
4.6运维保障资源库建设要求
在运维工作开展前期,把有助于用户运维的相关资料进行收集整理,以确保在实际运维过程中不会由于缺少沟通或者遗漏部分环节导致的问题处理延迟,具体保障资源如下:
? 机房设备相关资料收集:
整理各设备相关管理人员联系方式、设备物理位置等,书面文档与电子文档相结合,以确保出现设备故障或需要远程支持时能在第一时间联系到具体负责人,及早完成设备故障处理工作。
? 设备操作文档收集:
整理设备有关的操作文档,并整理成册,书面文档与电子文档相结合,辅助工程师处理相关问题。
? 设备配置库整理汇总:
整理所有设备原始配置资料,整理入库,且在修改设备配置后及时对录入的数据进行更新,以确保设备配置的准确性及安全性。
25
? 运维知识库的建立和维护:
收集维护过程中出现的各类资料,进行分类整理入库,为维护工作提供知识库。 4.7项目管理要求
维护团队应派遣一名具有专业知识的资深管理人员负责本项目的项目管理,统筹相关工作,项目监督与情况汇报,控制工作质量和预算,执行变更和应急情况管理,并根据实际状况调整服务方人员安排,以保证此项目的正常高效运作。 4.8质量管理要求
维护团队应根据本项目要求提出服务质量管理及监控具体措施,并对所提供的服务质量和标准做出明确可量化的承诺。 4.9技术交流及培训
维护团队应提供必须的服务技能培训,并对相关技术问题进行充分交流,以提高用户技术水平,使用户能熟练使用现有系统。培训包括不定期或面对面培训,并提供对部分用户简单故障排除方法培训。
5经费预算
项目预算金额为xx万元。
序项目 号 机房管理:服务器、存储、网络、安全设备及数据库日常1. 软件、中间件等基础支撑软硬件设施运行监测、定期维护 检查、故障处理、系统备份; 内容描述 (万元) 小计 备注 26
应用系统: 终端设备: 管理制度:制定运维技术管理、运行管理、备品备件管理、服务质量考核等相关制度,建立规范化标准化的运维体系。 网络安全运行监控,记录、监控相关安全事件; 专业网络2. 安全服务 应急响应、重大安全故障处理 主要硬件3. 设备维保服务 主要软件4. 系统维保服务 小计 服务器维修保养,包括服务器的电源模块、主板、硬 盘、内存、网卡等部件的维保; 系统安全巡检服务, 系统安全调优服务, 期驻场服务,4万/人·年。 专业技术服务工程师2人定
27