服务器巡检报告改
文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]
设 备 机 房 巡 检 手 册
网格(福建)智能科技有限公司
2014
巡检内容说明
一、 运行天数为开机天数,可在本地连接状态--常规里可以看持续时间或监控软件的
cpu up time时间; 二、 HP服务器的“内部健康灯”,绿色:正常 黄色:降级工作 红色:故障(处
理器、PPM模块、内存、风扇、温度过高问题)如果遇到不是绿色的情况,需要找出原因在说明栏中注明; 三、 HP服务器的“外部健康灯”绿色:正常 黄色:降级工作 红色:故障(一般
为电源问题)双电源供电的,查明是哪个供电模块,说明栏注明提出更换; 四、 HP服务器的“ UID灯”蓝色=激活 闪烁=系统被远程访问,这个指示灯的
状态只做为常规记录,如果在被远程的情况下,暂时不对此服务器进行巡查,以免影响远程人员的操作; 五、 IBM服务器的OVERSPEC指示灯表示只安装了一个电源,LOG 指示灯表示BMC日
志或者系统错误日志满(系统错误日志达到75%满),PS 指示灯一个电源故障或者电源未插,PCI 指示灯PCI适配器出现故障,SP 指示灯服务处理器(IMM)发生故障,FAN 指示灯风扇发生故障,或运行过慢,或已卸下。TEMP 指示灯可能也会点亮,TEMP指示灯系统温度已超出阈值级别。发生故障的风扇会导致 TEMP
指示灯点亮,MEM 指示灯当 MEM 指示灯和 CNFG 指示灯都点亮时,表示内存配置无效,NMI 指示灯系统已收到一个硬件错误报告。(PCI和MEM指示灯也可能点亮),CPU 指示灯CPU出现故障、丢失或者未正确安装,DASD 指示灯硬盘出现故障或者被卸下,RAID 指示灯RAID适配器出现故障,BRD 指示灯主板报错; 六、 能过命令net localgroup administrators查看管理员用户与列表中的是否一
致,并填写:一致、增加、减少的说明; 七、 查看安全日志,是否有无效的登录尝试等事件,是否有不在原列表中的用户登
录,并记录在说明栏中; 八、 查看应用程序日志,记录程序运行方面的事件,主要查看错误的信息,是否与运
行的程序相关,并填写记录; 九、 CPU响应能力 Queue,使用软件查看,在记录表中填写最高峰的值与时间,在说
明栏描述整体情况; 十、 物理内存利用率,使用软件查看,在记录表中填写最高峰的值与时间,在说明栏
描述占用内存的进程名; 十一、磁盘IO,使用软件查看,在记录表中填写最高峰的值与时间,并尽可能在说明栏
描述什么原因的读写; 十二、网络错误包,使用软件查看,如果出现了错误包,一定需要查明原因并排除,再
填写记录; 十三、开启服务清单为记录本台服务器上运行的服务程序,记录的目的是为便于对比程
序的变化及快速对服务器的情况进行评估; 十四、有磁盘使用可计算机管理—磁盘管里中查看,或使用监控软件查看,记录空闲的
百分比,当空闲少于10%即需要做出反应,一般为删除垃圾文件、备份删除日志、增加硬盘数量等措施。 注:使用的监控软件为spotlight on windows,可以互联网上免费下载,免费注册。
服务器巡检chack list 内网柜2-1
主机型号 CPU RAID HP DL180G6 Intel Xeon E5504 序列号 内存 CN700208M3 PID:AU673A 4GB 硬盘 250GB 运行 检查内容 类别 项目 内部健康灯 指示灯状态 外部健康灯 UID灯 管理员用户列表 运行Eventv查看安全日志 IP\\MAC 天 状态 □绿色 □黄色 □红色 □绿色 □黄色 □红色 □不亮 □蓝色 □闪烁 说明 □正常 □不正常
wr命令 查看应用程序日志 □正常 □不正常 说明 项目 CPU响应能力 Queue 系统资源记录 物理内存利用率 磁盘IO 网络错误包 最高值 % % 发生时间 功能描述 备注 进程名 开启 服务清单 C区 E区 D区 其他 磁盘使用 操作系统版本 其他说明: Windows Server 2003 Enterprise Edition 工程师签字: 巡检日期: 年 月 日 审核:
服务器巡检报告 外网柜1-2
主机型号 CPU RAID 类别 IBM X3650 Intel Xeon X5450 RAID 5 IP\\MAC 序列号 内存 检查内容 99BN568 PID:7979FXH 8GB 硬盘 300GB 安全运行 说明 天 项目 OVERSPEC指示灯 LOG 指示灯 PS 指示灯 PCI 指示灯 SP 指示灯 FAN 指示灯 TEMP指示灯 MEM 指示灯 NMI 指示灯 CPU 指示灯 DASD 指示灯 RAID 指示灯 BRD 指示灯 状态 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 如果只安装了一个电源,请添加一个可选电源 BMC日志或者系统错误日志满(系统错误日志达到75%满) 一个电源故障或者电源未插 PCI适配器出现故障 服务处理器(IMM)发生故障 风扇发生故障,或运行过慢,或已卸下。TEMP 指示灯可能也会点亮 系统温度已超出阈值级别。发生故障的风扇会导致 TEMP 指示灯点亮 当 MEM 指示灯和 CNFG 指示灯都点亮时,表示内存配置无效。 系统已收到一个硬件错误报告。(PCI和MEM指示灯也可能点亮) CPU出现故障、丢失或者未正确安装 硬盘出现故障或者被卸下 RAID适配器出现故障 主板报错 诊断板指示灯 运行查看安全日志 □正常 □不正常
Eventvwr命令 查看应用程序日志 □正常 □不正常 进程名 备注 项目 CPU响应能力 Queue 物理内存利用率 磁盘IO 网络错误包 数值 % % 功能描述 备注 进程名 开启 服务清单 D区 其他 磁盘使用 C区 E区 操作系统版本 其他说明: Windows Server 2003 Enterprise Edition 工程师签字: 巡检日期: 年 月 日 审核:
服务器巡检报告 外网柜1-1
主机型号 CPU RAID 类别 IBM X3650 Intel Xeon X5450 项目 状态 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 □正常 □不正常 序列号 内存 IP\\MAC 检查内容 99BN569 PID:7979FXH 8GB 硬盘 300GB 说明 OVERSPEC指示灯 LOG 指示灯 PS 指示灯 PCI 指示灯 SP 指示灯 FAN 指示灯 TEMP指示灯 MEM 指示灯 NMI 指示灯 CPU 指示灯 DASD 指示灯 RAID 指示灯 BRD 指示灯 运行Eventvwr命令 如果只安装了一个电源,请添加一个可选电源 BMC日志或者系统错误日志满(系统错误日志达到75%满) 一个电源故障或者电源未插 PCI适配器出现故障 服务处理器(IMM)发生故障 风扇发生故障,或运行过慢,或已卸下。TEMP 指示灯可能也会点亮 系统温度已超出阈值级别。发生故障的风扇会导致 TEMP 指示灯点亮 当 MEM 指示灯和 CNFG 指示灯都点亮时,表示内存配置无效。 系统已收到一个硬件错误报告。(PCI和MEM指示灯也可能点亮) CPU出现故障、丢失或者未正确安装 硬盘出现故障或者被卸下 RAID适配器出现故障 主板报错 诊断板指示灯 查看安全日志 查看应用程序日志 □正常 □不正常 □正常 □不正常 进程名 备注 项目 数值 % % CPU响应能力 Queue 物理内存利用率