好文档 - 专业文书写作范文服务资料分享网站

IT故障处理流程规定

天下 分享 时间: 加入收藏 我要投稿 点赞

Revision Change History Creation Date (YYYY/MM/DD) Originator’s function Description of Change (ECO#, Brief description) Rev Originator Note 1: Can keep the latest three revision change records; Note 2: Use red triangle marked in the changing area. Printed copies are NOT controlled unless marked \ The information in this document is the property of Boston Power. No part of this document may be disclosed, reproduced, or distributed without the express written permission of Boston Power. Boston Power reserves the right to alter the design and specifications of its products at any time without notice, as part of its continuing program of product development.“Boston-Power?”, “Sonata?” and “Swing?” are registered trademarks of Boston-Power, Inc., which retains sole rights to their use.? Boston-Power, Inc., 2009. All rights reserved. 目录 1. 目的: ................................................................................................................................................................. 3 2. 范围: ................................................................................................................................................................. 3 3. 定义: ................................................................................................................................................................. 3 4. 职责与权限: .................................................................................................................................................... 3 5. 系统管理员的职责和权限 ............................................................................................................................... 4 6. 内容 ..................................................................................................................................................................... 5 7. 故障上报方式和故障升级 ............................................................................................................................... 6 8. 应急措施与行动计划 ........................................................................................................................................ 7 9. 需要启动的其它紧急管理计划 ....................................................................................................................... 8 10. 紧急计划的终止 ................................................................................................................................................ 8 11. 中等故障以上事件处理完成通报和事后总结 .............................................................................................. 8 12. 证据保存方式和内容 ........................................................................................................................................ 9 13. 维护与解释 ........................................................................................................................................................ 9 14. 附件 ..................................................................................................................................................................... 9 1. 目的: 加强和规范IT事故/故障的处理和报告流程,保证事故/故障的快速恢复,使损失降低到最低。 2. 范围: IT部提供但不限于以下设备、系统和区域的事故/故障 2.1硬件类: IT办公设备(包括复印机、打印机、传真、扫描仪、投影仪、一体机、主机、显示器等) 语音通信设备(但不包含移动智能手机、平板电脑) 2.2网络类: 企业互联网(泛指公司与ISP连接的Internet线路) MPLS、VPN专线 网络/线缆接口 2.3应用和业务系统类 应用服务器(包括硬件和操作系统)、业务型ERP、生产型MES IT监控与门禁系统 数据库系统 互普准入系统 视频会议系统 考勤就餐系统 防计算机病毒系统 3. 定义: 3.1一般事故/故障:影响范围限于单个或者少量用户(不超过10人)的IT故障,不会对其它用户的IT系统使用造成大的影响和业务的中断。 3.2中等事故/故障: 关键系统小面积中断,不会造成重大业务影响,不会造成关键系统数据大量丢失或者错误。 3.3重大事故/故障:关键系统全局性或者大面积中断,或者造成关键系统数据大量丢失或者错误的,并且无法在短时间(30分钟)内恢复。 3.4关键系统主要指中断后会造成业务和管理无法进行的系统:如AD、DHCP、DNS、核心交换、路由、VPN系统、ERP系统、MES系统、存储系统、虚拟服务应用。 4. 职责与权限: 4.1 IT部所有员工均负有处理紧急事件的责任; 4.2 面对紧急事件,一切以公司利益和人身安全为重; 4.3 IT经理包括IT各组(Infra系统、ERP业务支持、CIM)经理; 4.4 IT经理作为IT流程中的控制结点,主要负责对其所辖关键IT系统的重大事情进行审批、管理和监控; 4.5 IT部门主要负责IT事故/故障发生后的事故处理和故障的排除,故障排除过程的记录,故障排除后事故发生原因的调查,后续改进或者预防措施的落实; 4.6 用户按要求途径报告事故/故障(IT故障申请单)。 5. 系统管理员的职责和权限 系统管理人员包括网络管理员、服务器管理员、数据库管理员和客户端管理员。 5.1 网络管理员 1) 提供网络运行保障,确保网络系统的稳定与正常运转,及时解决网络故障; 2) 负责网络系统的管理和维护,确保高效、可靠地管理网络资源; 3) 负责对网络设备操作系统和配置信息进行备份及恢复; 4) 负责或协助服务提供商进行网络设备的调试和安装; 5) 负责或参与网络工程的设计和网络设备的选型。 5.2 系统管理员 1) 负责安装和配置服务器操作系统及其它相关软件; 2) 负责监控并优化服务器系统资源的使用; 3) 负责计划和实施服务器系统备份及恢复方案; 4) 负责服务器操作系统及程序的升级; 5) 负责服务器系统用户和安全管理; 6) 负责为服务器操作系统打补丁; 7) 负责或协助供应商进行服务器硬件管理和故障诊断。 5.3 数据库管理员 1) 负责确定数据库的信息内容和结构,并可操作数据库; 2) 负责制定数据库的存储结构和存取策略; 3) 负责定义数据的安全性要求和完整性约束条件; 4) 负责监控数据库的使用和运行,分析数据库的性能并进行问题诊断; 5) 负责数据库的改进和重组重构; 6) 负责数据库的安全与日常维护,制定并实施数据库系统的备份和恢复方案。 5.4 客户端管理员 1) 负责客户端用户(网络终端结点的用户)设备的维护; 2) 负责客户端用户的安全管理、软件维护和设备的配置及环境管理等。 6. 内容 6.1 异常情况和紧急事件一般处理流程和响应机制 1) 员工发现网络设备、服务器设备相关的异常情况和紧急事件,直接联系IT相关经理。同时,对网络设备、服务器设备均有监控系统对其工作状态进行监控,一旦发生服务不可用事件,监控系统会及时监测并就异常情况报警; 2) 对于员工电脑或信息系统使用问题,通过提交IT故障申请单或通过拨打IT热线 3155、3565、3576电话向IT Helpdesk进行报修故障,IT Helpdesk人员会根据故障现象直接处理问题,或指派专人进行处理; 3) 对异常情况和紧急事件应进行分类和记录,应在事后对事件进行分析和汇报。 6.2 常见异常情况的安全控制措施 6.2.1 电力故障应急方案 1) 在非正常工作时间,任何人发现电力系统出现异常,有义务及时通知厂务部和安保。厂务部和安保部负责马上联系IT部员工说明情况; 2) 电力系统出现故障,厂务部安排人员负责检查处理电路故障,同时向IT部提供估计停电持续时间和恢复时间; 3) IT部为机房配备UPS(不间断电源)并定期对UPS进行充放电测试; 4) 发生电力系统异常后,在UPS第一次报警后(估计还能维持半个小时),电话通知正在使用业务系统的key user 后,开始关闭服务器和网络设备,以防止UPS耗光损坏计算机设备; 5) IT部跟踪停电详细情况及处理情况,并做好记录,上报给公司安全管理责任负责人。 6.2.2 火灾应急方案 1) 在机房门口(里外各一个)部署专用气体灭火器(二氧化碳灭火器); 2) 当出现火情、火灾时,任何人员都应保持镇静,应及时采用一些简单可行的方法作初步处理,如:使用灭火器、水源、或采用一些灭火措施、手段。如果火情危机机房或在机房发生,必须使用机房专用气体灭火器(二氧化碳灭火器); 3) 在对火情、火灾进行初步处理的同时,应在最短时间内通知设施部EHS和保安部; 4) 若火情较严重时应迅速打电话报警,同时注意个人人身安全。在判断到火情失控情况下,应马上撤离火灾现场到安全的区域; 5) IT部了解火灾情况并做好详细记录,上报给公司安全责任负责人; 6) 机房均为电器设备,应定期检查这些设备,减少由于电器故障引发火灾。 6.2.3 网络系统瘫痪应急处理方案 1) 发现网络故障,立即通知网络管理员; 2) 网络管理员检查网络情况,初步确定故障原因; 3) 如网络设备发生严重故障,导致网络无法正常运转,应立即通知相关人员或设备供应商,同时启用网络备用设备; 4) 如果是线路故障,应立即启用备用线路;

IT故障处理流程规定

RevisionChangeHistoryCreationDate(YYYY/MM/DD)Originator’sfunctionDescriptionofChange(ECO#,Briefdescription)RevOriginatorNote1:Cankeepthelatestthreerevi
推荐度:
点击下载文档文档为doc格式
7qucc0m07p47le14lopx1jxus0hkxz00vx5
领取福利

微信扫码领取福利

微信扫码分享