云平台服务器存储
应急预案
目录
1 2 3
目的 ........................................................ 3 适用范围 .................................................... 3 规范内容 .................................................... 3
3.1 3.2 3.3
故障分类 .............................................. 3 应急准备 .............................................. 3 具体措施 .............................................. 3
4 故障处理规范 ................................................. 4
1
4.1 4.2 4.3 4.4 4.5 机房停电 .............................................. 4 主机故障 .............................................. 4 存储系统故障 .......................................... 4 云平台软件系统故障 ...................................... 4 云平台管理服务器故障预防 ................................. 5 4.6 云平台日常告警故障排除 ................................... 5
硬件故障预防与排除 ........................................... 55.1 故障预防 .............................................. 55.2 故障排除 .............................................. 55.3
故障处理 .............................................. 6
2
5
1 目的 为提高云平台服务器、存储故障处理能力,形成科学、有效、
反应迅速的日 常管理流程和应急处理机制, 确保平台的安全和稳定运行, 最大限度地减小故障 对生产的影响,降低业务中断风险,特制定本规范。
2 适用范围 本规范适用于提供云计算虚拟化平台服务的服务器、 存
储管理,应对发生和 可能发生的故障。
3 规范内容 服务器运维和应急处理应包括风险评估, 检测体系和应
急处理三个环节, 合 理有效的执行控制将防止故障影响扩大。
3.1
故障分类 平台故障包括服务器硬件和存储系统故障;自然灾害(水、
火、电等)造成 的物理破坏;人为误操作造成的损害等。
3.2
应急准备 部门责任人员明确职责和管理范围, 根据实际情况, 安排
应急值班, 确保到 岗到人,联络畅通,处理及时准确。
3.3
具体措施
(1) 建立安全、可靠、稳定运行的机房环境,防火、防雷电、防水、防静
电、防尘;建立备份电源系统。
(2) 虚拟化平台服务器应采用可靠、稳定、兼容性硬件,落实责任管理机 制,遵守安全操作规范; 对虚拟机和管理服务器进行定时备份; 采用有效的虚拟 化监控工具,及时发现问题和日报告。
故障处理规范
4.1
机房停电 接到停电通知后,相关人员应及时部署应对具体措施,启动
备用电源 , 保证 服务器正常运行。
3
完整word版,云平台服务器存储应急预案



