驻场技术服务内容
为确保甲方相关设备完好,运转正常,驻场技术服务包括规范性日常维护、巡检、变更、故障应急响应、系统问题处理等工作范围,具体内容如下:
一、日常系统巡检
1. 进行LINUX系统层面的巡视检查
? 包括计算资源CPU/MEM/HD负载及利用率 ? 内核版本/操作系统版本 ? 系统运行时间/登入用户信息 ? 网络接口状态、网络延迟丢包率 ? 重要端口监听、进程状态 ? 日志错误信息分析 2. 硬件健康状态检查
? IPMI管理界面中信息硬件运行状态 ? RAID驱动状态
? CPU温度、风扇、固件等状态 3. 重点保障业务的服务检查
? 包括SELINUX/FIREWALL/SSH/NTP/Crontab服务
? 包括云管平台/Ansible Tower/OSP/Ceph/ITIL/备份系统/脱敏系统等基于
Tomcat/HTTPD/NGNIX的Web应用
? Pacemaker集群服务状态/Ceph OSD状态/计算、存储、网络、控制节点服务
状态
4. 常用系统运维工具(示例)
? Ansible Tower自动化运维工具 ? Solarwinds监控工具 ? ITIL运维管理系统 ? 身份认证及审计系统
1
见附件(一)模板 二、监控与分析
1. 通过IT资源监控系统,针对业务系统所依赖的网络、硬件、安全、系统、
服务、端口等进行监控,记录保存并按重要性级别分类,形成书面报告; 2. 负责对监测和报警记录进行分析、评审,发现可疑行为,形成分析报告,并
采取必要的应对措施;
3. 负责运行日志、监控记录的日常维护和报警信息分析和处理工作,提出优
化建议及方案;
4. 根据厂家提供的软件升级版本对网络设备进行更新,并在更新前对现有的
重要文件进行备份;
5. 定期对系统进行漏洞扫描,对发现的系统安全漏洞进行及时的修补; 6. 定期检查违反规定上网或其他违反网络安全策略的行为;
7. 专人进行核心服务器的工作压力监控,针对业务的增长定期生成主服务器
的工作压力报表,并且预估业务增长对服务器压力的影响提出合理化建议; 8. 专人进行核心数据库的工作压力监控,定期生成报告,并就改进提出合理
化建议。
三、变更/问题管理
1. 负责新的业务系统搭建技术支持 ? KVM的部署
? 基于KVM的各虚拟系统的创建(Windows/Linux) ? 网络路由配置 ? 防火墙配置 ? 数据库部署 ? 应用软件部署及配置 2. 软件版本升级更新支持
? 应用组件RPM包安装、卸载、升级 ? 系统核心软件包升级 3. 系统配置参数调整更新
2
? HOSTS/DNS/SSH/Crontab/HTTPD/Profile/Env环境变量等参数变更 4. 漏洞补丁修复巩固
? 系统及软件Bug release修复 ? 安全补丁更新 四、备份与恢复
1. 根据实际应用情况、根据生产相关数据的连接关系、根据应用的业务特点
和软硬件资源,制定详细的系统数据备份计划,确定合理的系统备份策略。定期备份重要业务信息、系统数据及软件系统等;
2. 应根据数据的重要性和数据对系统运行的影响,执行数据的备份,每月提
交数据备份报告,必要时实施数据恢复;
3. 按照控制数据备份和恢复过程的程序,对备份过程进行记录,所有文件和
记录应妥善保存;
4. 按要求,定期执行恢复程序,检查和测试备份介质的有效性,确保可以在恢
复程序规定的时间内完成备份的恢复; 5. 制作备份和恢复的管理规范以及操作步骤手册。
《备份作业清单》
《数据备份与恢复管理规范》
五、资产管理
1. 硬件资产及相关设备进行生命周期管理
包括设备品牌、型号、硬件参数、IP地址、维保信息 2. 软件资产的统计及其生命周期管理
包括软件名称、厂家、版本、License、维保信息
六、安全事件处置
1. 通过现有安全管控系统及时报告所发现的安全弱点和可疑事件; ? 抗DDOS-查看攻击源书和数据量 ? 防火墙管控内外网
? 天池云堡垒机安全访问控制 ? 综合日志管理提供审计功能
? 大数据分析及综合漏洞扫描提前预防 ? 网页防篡改提供安全的网站防护
3