运维服务手册模版

(1) 定期巡检

我们的运维服务人员每年提供设备现场巡检服务,为本项目中的设备提供定期预防性巡检服务。我们的运维服务人员将详细、全面分析客户计算机及网络系统存在的隐患与安全漏洞,并免费更换所有故障损坏配件,更换配件的品牌、型号、性能不得低于原设备配件档次,36 小时内通过更换配件方式仍然不能修复的,我司会免费提供替代设备,替代设备配置和性能不得低于原有设备。必要时将及时提醒客户,进行设备调整和优化,保障维保设备的正常运行,并提交书面巡检报告。

(2)巡检原则及注意事项

我司采取措施确保整个信息系统运转的高效、稳定和安全,减少和避免系统性能瓶颈,杜绝信息系统安全事故。
我司在合同约定日内完成系统巡检指南编写工作;故障处理需形成故障处理报告,设备巡检完成后三个工作日内提交设备巡检报告,根据招标方需要增加或修改设备巡检内容。

(3)事先沟通

运维服务工程师接到巡检任务后,首先与客户运维人员联系确认本次巡检计划和安排。
1、与客户运维人员应该沟通的事项

  1. 确认巡检时间、地点;
  2. 确认巡检报告模板等;
  3. 提前了解巡检设备清单,包括设备序列号、巡检机型、巡检机器数量及此次巡检计划和工作量;
  4. 确定客户配合人员、约定具体到达现场的时间、巡检的地点,如中途遇到问题不能及时到达,应及时通知用户请求谅解并通知巡检管理员;
  5. 确认客户具体上、下班时间;
  6. 了解客户是否有其它潜在需求,比如是否有顺便要求更换备件或者设备调试等。
    2、实施准备
    必要工具
    巡检工具分为两类,一类为通用工具,做任何设备的巡检都需要带的;另一类为专用工具,针对某一类型设备。
    如果巡检还需要处理设备故障,则需要带好相关设备故障处理工具。
    通用工具
    笔记本电脑及 U 盘、网线、防静电手镯或防静电手套、电压表、湿度计、温度计、刷子、各种类型(包括梅花,平口,六角及套筒等)螺丝刀。
    专用工具
    小机:USB 转 DB-9 转接头、九孔-九孔串口线(female-female)、Torx。
    网络设备:console 线、USB 转 DB-9 转接头、DB-25 转 RJ-45 转接头(举例: Cisco 7500 系列等用到)、DB-9 转 RJ-45 转接头等。
    2、文档准备
    技术服务单、巡检报告、巡检设备清单、巡检计划、相关设备的巡检信息收集脚本。

(4)现场巡检

1、注意事项
工程师现场将严格遵循客户交付线规范性相关内容,包括但不限于
遵从用户工作场所纪律;
在现场接听电话应该控制音量,以免影响他人办公;
如需要使用自己的笔记本电脑接入客户公司网络内,首先要和客户确认要配置的 IP 地址,最好让客户帮忙更改 IP 地址,然后再接入网络;
插笔记本电源线时,一定要让客户给指定插口,不要私自找插口随意插电源线;
一定要征得客户的允许才能将自带 U 盘接入客户的机器拷贝日志文件;
发现客户的系统有配置不合理的地方,应先给客户提出,即使最简单的调整,也要征得客户同意后再做,切不可私自对客户的机器进行调整;
维保范围之外的设备切记乱动;
所有操作尽量在客户下班前做完,不能按时完成,可以与客户商量,客户如不同意加班,需要告知巡检管理员择日再做。
2、现场巡检实施流程

  1. 到场签到
  2. 巡检前与客户沟通
  3. 工作内容
  4. 见面后首先向客户确认此次的工作内容(如机房环境、主机系统、系统备份管理等),介绍本次巡检方案。
  5. 机房环境
  6. 了解客户是否是双 UPS 供电,不是的话要提醒客户这方面风险;
  7. 零地电压要小于 1V,电压波动小于 10V,否则机器容易损坏;
  8. 要让客户明白湿度太高或者太低都对机器的寿命故障率有所影响;
  9. 温度是环境里的重点,因为温度过高会导致机器自动关机,尽量要求客户保证机房温度在规定范围内,如果温度不在规定范围内要提醒客户注意和改善,比如增加独立的风扇或者空调。
  10. 主机系统
  11. 向客户了解系统和数据的备份情况。
  12. 系统备份管理
  13. 一般情况下,如果系统盘做了镜像可以不要求备份,但一般建议用户做系统备份。如果客户有重要参数和配置调整时建议备份后进行。客户应用数据方面,要了解客户的备份情况,特别是要了解客户的备份是否做过恢复测试,或者以前是否恢复过,保证客户的备份机制可以正常地进行恢复。
  14. 系统高可用性
  15. 在机型的允许下尽量都做冗余。比较重要的是硬盘和电源。如果硬盘没有镜像或者电源没有冗余,都要提醒客户注意或者建议整改。
  16. 如果有 cluster 存在,除了检查 cluster 是否正常外,要先客户了解最近一次的切换测试是什么时候,是否正常。是不是上面的所有业务及相关软件都是可以自动切换的。
  17. 近期系统运行状况及日常维护管理
  18. 了解设备运行情况,如出现的问题和客户的疑问,并给予解答。如不能确定回答用户问题,可以现场电话联系二线专家给用户答疑,或记录问题,告知用户待问题确认后再告知用户。
  19. 如果现场发生硬件故障,应及时与后台技术专家确认故障原因,查清备件号,并通知进行备件响应。对于有冗余的硬件,要向客户表明,避免客户过分担心。

(5)编写巡检报告

巡检报告要按照附录中设备巡检报告模板在巡检报告生成服务器来创建巡检报告。如果巡检日志中存在疑难故障隐患等信息,应寻求技术专家帮助进行分析,以形成最终巡检结论。如确认系统存在问题或隐患,应向服务台报告故障内容,作为突发事件转突发事件处理流程。
巡检报告应在巡检管理员规定的时间内编制完成,并提交巡检管理员。由巡检管理员按照承诺客户的时间提交报告给客户。

(6)巡检报告解读

巡检管理员将巡检报告发给用户后,根据情况,可能需要巡检技术人员与用户对巡检报告重要信息进行沟通。

(7)首次巡检

为做好客户后续维保服务工作,我司运维服务人员会在项目落地后,进行全面细致的首次巡检。
巡检时间:首次巡检在合同约定日内开始;
人员安排:由我方工程师及贵方相关技术人员共同组成;
巡检职责:对贵方的设备及系统进行全面检查与分析,详细了解维保设备的硬件、软件及相关系统状况;
巡检档案:填写首次巡检报告,双方签字确认,并建立后续维护服务档案;
问题汇报:首次巡检过程中如发现服务对象存在故障或者存在服务对象与合同约定不一致,及时将情况汇报给双方相关部门。
首次巡检内容:
场地环境检查:包括机房环境温度和电源状况等的检测;
主机硬件检查:包括主机设备操作面板 LCD 显示、设备电源、风扇系(3)统工作状况、控制卡的状态指示、设备的电缆连接,并对设备进行保洁,保持良好的运行状态;
系统检查:分析日志文件、系统健康、诊断设备的运作状态、系统配置检查、系统运行情况分析,系统总体性能评估;
存储外设检查、系统和数据备份检查及磁盘空间检查;
调整优化包括软件配置上的调整以及硬件配置上的优化;对设备进行保养和维护等。
首次巡检后我司备件中心将根据收集的设备配置信息制定备件储备计划,确保后续系统发生故障时备件及时响应。

(8)定期巡检内容

巡检工作内容:
场地环境检查;
硬件设备检查;
系统日志检查;
系统配置检查;
系统备份检查;
系统总体性能评估;
预防性维护的总结及建议。

下载附件:运维服务手册.doc

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×