服务器运维管理手册
LIMS系统
服务器运维管理手册
2016-10-24
1
服务器运维管理手册
一、 文档简介 ......................................................................................................................... 3 二、 文档目的 ......................................................................................................................... 3 三、 文档范围 ......................................................................................................................... 3 四、 事件处理流程 ................................................................................................................. 4 五、 具体操作说明 ................................................................................................................. 4 1) 服务器硬件管理 ................................................................................................................. 4 2) 服务器系统管理 ............................................................................................................... 10
1. Windows系统管理 ................................................................................................ 10
2
服务器运维管理手册
一、 文档简介
本文档根据cc服务器硬件设备与系统应用管理需求,针对日常维护内容进行技术归类于总结,描述具体操作步骤与操作方法,积累服务器事件处理能力,使之服务运维能力更为主动可控。
二、 文档目的
标准服务器故障处理方法指引,服务器管理知识库积累。
三、 文档范围
服务器硬件故障判断与标准处理操作 服务器系统日常性能检测与标准检测
3
服务器运维管理手册
四、 事件处理流程
五、 具体操作说明 1) 服务器硬件管理
1.检查与故障判断:
服务器硬件的主动检查方式主要分三种: 设备面板指示灯检查 硬件系统日志检查
4
服务器运维管理手册
第三方工具检查 (一)面板指示灯检查
IBM服务器上面有,电源指示灯,硬盘/IDE设备活动指示灯,网卡指示灯,系统过热报警灯.硬盘槽还有硬盘指示灯。HP服务器上面指示灯一般为UID,内部和外部健康灯,其他就是电源网口灯了,DELL的机种有的上面有风扇,内存,CPU,指示灯情况,图标都是很直观的,其它服务器与IBM,HP的差不多。
图示说明
详细描述:
5
服务器运维管理手册
6
服务器运维管理手册
7
服务器运维管理手册
(二)系统日志检查 检查内容 硬件历史异常报错信息 计算机管理->系统工具->事件查看器,查看系统日志 重点关注:红色高危事件信息、日常频繁硬件报错信息 备注:查看硬件历史异常故障情况,分析硬件性能与使用生命周期 (三)第三方检测工具检查 检查内容 硬件历史异常报错信息 HP 诊断工具: 打开开始——程序——HP System Tools——HP Insight Diagnostics online Edition for Windows——HP Insight Diagnostics online Edition for Windows。 DELL诊断工具: 第三方硬件设备诊断工具 IBM诊断工具: IBM Systems Director 、 IBM Systems Director Active Energy Manager、IBM ServerGuide 相关图解:
进入诊断网页,在第一选项卡Survey中,上部有2个下拉项,左侧选择Advanced,右侧选择All,会显示出更多硬件信息,点击右下的Save按钮保存。
8
服务器运维管理手册
此界面可以看到服务器所有硬件信息。
2.硬件设备变更操作标准:
判断并确定最快恢复时间 判断是否有做冗余设置 判断是否需要关机操作
磁盘设备检测并确定阵列信息,确定有做数据备份 是否对其它关联应用有影响
制定回退方案,保证数据与应用的可用性 设备变更操作 设备兼容性测试 应用系统运行测试 设备变更后正式应用
9
服务器运维管理手册
2) 服务器系统管理
服务器系统管理为:
AIX系统管理
1. AIX系统管理
1.1. 磁盘空间使用
df -g命令
磁盘空间使用率是否已经到达80%
1.2. 进程监控、CPU性能、磁盘读写率
topas命令
查看进程的CPU使用率和磁盘读写率是否超阀值
10
简单操作_服务器运维手册



