这部《运维宝典》,一半人后悔看见晚了,一半人看完马上改制度......
网络运行,凝聚着前辈工程师的智慧和心血;运营网络,是我辈维护工程师赖以发展和安身立命的根本;运维规程,是维护网络稳定和安全的有效保障。运维规程包括机房安全管理制度、值班和交接班制度、故障处理及上报制度、局数据管理制度、割接管理制度,重大网络调整管理制度和网络设备操作安全管理制度等。

一机房安全管理制度


1. 机房出入管理通信重地,持证进出有证持出入证者,可以进出机房无证无出入证者,不得进入机房厂家厂家操作需在联通员工陪同下登记进入纪律厂家不得乱翻、乱动、拍照、录像2. 做好“七防”工作

3. 机房安全管理制度布线规范交流电源线、直流电源线、信号线应分开敷设。电源线、信号线不得穿越或穿入空调通风管道。禁止乱拉临时电源线。设备管理应保持机房整齐、清洁;保持设备排列正规,布线整齐。油机房和储油间应分开设置,储油量不得大于8小时的油机工作用油量。应配备有仪表柜、备品备件柜、工具柜和资料文件柜等。各类物品应定位存放。安全管理按要求配备防毒面具 、灭火器等安全防护设备。各种灭火设备定位摆放,定期对防火设施设备进行检查。机房内非特殊需要,严禁使用明火。如确实需要动用明火,须经主管领导批准,并采取相应防范措施。综合值守人员应具备综合值守能力。综合值守人员及门卫必须接受防火培训。油机房和储油间应分开设置,储油量不得大于8小时的油机工作用油量。门内外、通道、路口、设备前后和窗户附近不得堆放物品和杂物,以免妨碍通行和工作。4. 无人值守机房

无人值守机房要全封闭,保持机房防尘。无人值守机房定期巡视检查。对于不具备监控条件且规模较小的局站,应缩短巡视周期,主要设备应具备遥信功能。在灾害气象条件下应加大巡视强度,以确保机房室内外环境的良好与安全 。5. 施工人员管理施工人员必须履行申报手续和登记审批制度,持有上级有关部门的批准的施工单,履行入室登记手续并由专人随工陪同。随工人员必须全程陪同并承担施工场的管理责任。二值班和交接班制度

1. 值班制度值班人员坚守岗位,认真完成作业计划,严格执行操作规程,准确填写值班日志,按规定进行交接班。两人以上同值班,必有一个值班长。生产现场保整洁,无关物品勿入房。2. 值班纪律遵守故障规定,及时处理和上报异常,勿推诿拖延故障处理,勿关闭或删除告警,遵守通信纪律,提高安全保密意识。不得人为切断和私人占用业务电话或用户电话。3. 交接班制度时间纪律交接班应准时,接班员未到岗,交班员勿离岗。值班日志交班员做准备, 填写值班日志表。双方检查交班内容,确认无误需签字。交接时故障处理交班前未处理完或交接时发生的故障,双方共同处理,直至故障消除或告一段落再交班。漏交、错交故障漏交、错交交班前产生的故障,交班人承担相应的责任。漏接、错接故障接班人漏接、错接故障,接班人承担责任。双方均未发现的问题交接双方均未发现的问题由双方共同承担责任。三故障处理和上报制度

1. 集团规定故障等级故障处理特别重大领导现场指挥、制定预案、15分钟上报、4小时简报、24小时书面报告重大领导现场指挥、制定预案、4小时简报、4日内书面报告较大技术骨干处理、4小时口头报当地主管部门、24小时简报、4日内书面报告一般及时处理,每月汇总上报2. 省内规定故障级别故障处理特级通知至省公司分管运维副总经理、分公司总经理。半小时内抢通一级通知至省公司运维部总经理、地市分管运维副总经理、半小时内抢通二级通知至省公司运维部副总经理、分公司运维部经理。一小时内抢通。三级省公司科室经理、分公司运维部副经理、四小时恢复3. 故障处理原则


上层网络维护人员判断是否影响本层网络业务;判断是否需要启动应急预案;协助下层网络维护人员准确定位。下层网络维护人员通知上层网络维护人员。4. 跨专业、跨地市故障处理当故障处理涉及两个专业网时,应由业务网为业务领导,并为此规定如下:1).传输与交换之间以交换为业务领导;2).传输与数据之间以数据为业务领导;3).传输与线路之间以传输为业务领导;4).长途传输与本地网传输之间,以长途传输为业务领导;5).以数据网为承载时,数据与交换之间以交换为业务领导;6).以数据网为承载时,数据与移动网之间以移动为业务领导;当省内跨域集团客户故障处理涉及两个地市分公司时,应由业务发起地市分公司为业务领导,牵头全程故障处理工作。四局数据管理制度

1. 管理内容数据分配、申请、下发、制作、修改、核查。中国联通通信网的局数据包括各通信网的用户数据、系统数据、业务数据、路由数据、端口数据、国际漫游数据等。2. 总部职责负责移动网全网和固网省际骨干网局数据的管理。对各省级分公司提交的局数据申请进行批复;下发与其他互联电信运营商间的网间局数据。定期下发局数据的核查文件,制定修改相关技术文件。监督、检查、考核各分公司局数据制作情况以及协调处理因本网局数据原因引起的省际及网间问题。3. 省分职责负责本省局数据的申请、分配和下发。按总部运行维护部的要求完成本省网内及网间局数据的制作。转发总部运行维护部局数据文件并下发相应的局数据制作工单。监督检查局数据的制作情况;协调处理与本省局数据有关的问题。4. 局数据管理要求测试数据以调度文件为依据,时限过后需删除。已失效数据及时删除,按计划及时清理。对于全网类业务数据和可能影响漫游用户的本地类业务数据,各省级分公司需收到总部下发的局数据调度工单后方可制作。对可能影响业务的局数据修改应安排在业务闲时(凌晨0点至6点),一人制作一人核查,做好测试,保存log和脚本 。各级调度部门应定期组织对本辖区内局数据的核查工作,核查结果应记录备案。5. 局数据管理纪律未经上级调度部门许可,下级调度部门不得做。总部负责制作的各骨干网全局性数据,各省级分公司不得做。现网用户相关数据由营帐系统完成,各省级分公司不得擅自做。五割接管理制度


1. 什么是割接设备的入网、退服、替换、搬迁、改造、扩容各类传输线路割接以及需中断业务或具备较大网络风险的其他网络作业2. 割接管理制度总部直接组织实施割接工作受理各省级分公司提出的割接申请对申请进行审核批复协助各省级分公司实施割接工作各省级分公司负责本省割接工作的管理制定具体的割接方案工程部门、设备厂家一起制定技术方案和实施细则报上级调度部门批准割接实施部门提前将割接影响的用户范围、时间和业务类型等信息通知相关部门市场、客服、互联互通等做好宣传以及与相关单位、大客户的解释工作通知到客户,避免客户投诉客户割接前告知,割接中确认,割接后回访割接前对割接对象进行各项测试对周边网络进行检测对网络各相关性能指标进行检查和记录割接后必须进行相应的测试验证工作密切注意网络运行情况比对割接前后系统、网络运行指标,确保网络安全运行六重大网络调整管理制度

1. 网络调整网络调整、寻址方式、话务流向、路由指向、带宽、其他需通过其它省份或其它网络疏通业务时,应先向总部运行维护部提出调整申请 ,由总部运行维护部进行组织协调与实施,不得私自进行业务调整!2. 实施重大网络调整期间各省级分公司必须严格服从总部的指挥调度对总部下发的调整方案进行细化配合总部直接操作辖区内设备3. 重大网络调整结束后密切监控网络运行情况出现异常情况上报总部运行维护部各级调度部门对网络调整过程中涉及的各类文档整理备案七网络设备操作安全管理制度

1. 账号权限管理要求各网络设备维护单位应实行账号的分权、分域管理,并遵循最小授权和权限分割原则设置不同的用户权限。账号权限实行分级管理,至少分为系统管理员、操作管理员、一般用户三级。设备、操作人员、账号应一一对应,账号实名制管理并记录,账号分组管理,当操作人员多于最大用户数时,监控账号可按规定共享。代维公司人员、临时工权限应纳入统一管理范畴;厂家维护人员账号只有查询命令权限;深度巡检、故障处理等情况需联系管理员分配临时账号并登记;通过网管登陆设备时,用户权限应与维护人员操作权限对应。系统管理员调动、离职、岗位调整时需维护部门领导批准,维护部门领导 需向新系统管理员确认原系统管理员的账号密码已及时修改并登记。网络设备员调动、离职、岗位调整时,需新系统管理员 依据维护单位领导批准,及时增加、删除、修改维护人员的账号或权限并备案。系统维修、在线工程扩容、远程登陆等情况 下,申请人 向网络设备所属维护单位提交申请,系统管理员 依据维护单位领导批准分配并及时删除或收回临时账号。网络设备建设工程初验通过后,应及时收回设备厂家人员的账号权限 ,删除系统的测试账号 ,对需要保留的账号应重新进行密码设置。2. 账号密码管理要求

3. 远程登录账号的管理如网络设备具备条件,应设置远程登录自动退出时限,在空闲10分钟后自动断开。应启用网络设备对远程登录用户的IP地址校验功能,保证只能从特定的IP地址上远程登录。远程登录工作结束后,维护人员须关闭远程登录端口;使用MODEM远程登录时,远程登录工作结束后,维护人员须关闭MODEM电源。维护单位负责人应定期检查网络设备远程登录情况的相关记录。4. 高危指令的管理在设备网管功能支持的情况下,高危指令执行之前要求输入二次授权密码。高危指令的授权密码应由上级管理人员或部门指定的技术专家负责掌管,为确保快速应对网络维护中可能出现的突发状况,授权密码可同时由二至四人共同掌管,确保在有必要紧急执行高危指令的情况下能够快速完成审批授权。除非紧急处理网络故障,原则上高危指令的操作应安排在业务闲时进行,并坚持一人制作一人核查的原则,在执行高危指令之前应由另外的维护人员完成指令的核查工作,确认无误之后方可执行。高危指令执行完成后,应从网络告警、设备运行日志、网络性能统计、业务测试等多方面进行全面的结果确认,一方面确认高危指令的执行是否成功和达到预期效果,另一方面确认高危指令的执行是否对网络造成了预期之外的不良影响。在各类设备的具体维护工作中,可能存在多网元操作和批处理操作的场景。多网元操作是指同时对多个网元执行操作指令,批处理操作是指同时对某一个网元批量执行操作指令。多网元和批处理操作场景中严禁执行高危指令。多网元和批处理操作场景中一般指令的执行必须获得上级管理人员的授权。5. 网络设备的防病毒管理除设备生产厂家明确规定不能安装防病毒软件的情况外, 网络设备系统(含操作终端)均应安装防病毒软件 。禁止安装使用来历不明的、没有版权的软件;禁止作办公用途,收发公网信息;严禁安装与业务无关的程序和软件;严禁在生产用机上使用来历不明的媒介 。任何软件或数据加载至网络设备(含操作终端)前, 除设备生产厂家明确规定外,均应进行防病毒检查。及时了解病毒预警信息及防范措施;定期检查杀毒软件的可用性;定期(至少每周一次)更新杀毒软件的病毒库;定期(至少每月一次)对所有文件进行病毒检查 ;主管应审阅结果;及时解决问题。八附录


运维秘诀之通传通报发现故障莫心慌,通传通报有规章;电话微信加短信,十分钟内要完成;电话打给包机人,故障影响要确认;通报对象要齐全,故障描述要清晰;跟进故障要及时,特一二级半小时;三级故障一小时,有进展时勤跟进;告警消除要确认,故障恢复需通报。运维秘诀之交接班监控值班7X24,值班人员勿懈怠;值班岗位需坚守,未过考核勿单独;值班日志要完善,生产现场要整洁;交班前应先准备,接班未到勿离岗;交接班时需检查,故障未结需跟进;漏交错交交班承,漏接错接接班负。运维秘诀之故障处理故障处理有原则,主次分清慎操作。先抢通,后修复;先核心,后边缘。先本端,后对端;先网内,后网外。故障处理要注意,深入彻底四不过。原因不清不放过,责任不清不放过。落实不力不放过,不受教育不放过。发现故障要派单,工单流程请牢记。2小时内要申报,10分钟内要通知。处理时间视级别,故障确认要及时。分析审核非一人,时间间隔要确认。工单派出需跟踪,三日归档勿忘记。运维秘诀之局数据局数据,谨遵守,先审批,后执行,制作工单为根本。定方案,再执行,慎操作,细核查,数据制作找空闲。查数据,看工单,经审批,方不误,查询工单成闭环。做数据,守原则,一人做,一人审,相互监督零差错。高效率,更可靠,既及时,又准确,叮嘱样样别忘却。制作完,勿懈怠,静观察,测功能,异常勿忘报主管。修改完,勤备份,有记录,有保存,小心谨慎没祸患。做备份,异地存,电子档,要更新,周期备份按类分。以上资料来自广东联通运维部推荐关注其【运筹维沃】公众号▼再来围观一下广东联通机房内景你就明白他们绝非只是纸上谈兵









嗯!这就是我心中的匠心网络!这样的网络值得我们选择!

小手一抖,立马转走!