420 likes | 565 Views
项目四 传输网维护. 在项目软调组完成 M 县新建智能光城域网络的业务配置工作后,网络将可投入运营,为了确保传输网络能够长期稳定地正常运行,必须对网络进行日常的维护和管理,对网络的运行状态进行监测和控制,在网络出现故障的情况下要及时有效地解决问题,使其能够有效、安全、可靠、经济地提供服务。 M 县电信运营商将该新建光城域网络的维护工作交给项目维护组完成。. 项目描述. 维护组将传输网维护项目分解成两个子任务完成: 1 )日常维护 2 )故障处理. 项目分解. 项目四 传输网维护 任务 9 故障处理. 1. 掌握故障处理的基本原则和基本流程; 2. 理解各类故障原因;
E N D
在项目软调组完成M县新建智能光城域网络的业务配置工作后,网络将可投入运营,为了确保传输网络能够长期稳定地正常运行,必须对网络进行日常的维护和管理,对网络的运行状态进行监测和控制,在网络出现故障的情况下要及时有效地解决问题,使其能够有效、安全、可靠、经济地提供服务。在项目软调组完成M县新建智能光城域网络的业务配置工作后,网络将可投入运营,为了确保传输网络能够长期稳定地正常运行,必须对网络进行日常的维护和管理,对网络的运行状态进行监测和控制,在网络出现故障的情况下要及时有效地解决问题,使其能够有效、安全、可靠、经济地提供服务。 M县电信运营商将该新建光城域网络的维护工作交给项目维护组完成。 项目描述
维护组将传输网维护项目分解成两个子任务完成:维护组将传输网维护项目分解成两个子任务完成: 1)日常维护 2)故障处理 项目分解
项目四 传输网维护 任务9 故障处理
1.掌握故障处理的基本原则和基本流程; 2.理解各类故障原因; 3.熟悉各种故障定位分析方法; 4.熟悉SDH设备的典型故障类型及分析处理流程; 5.通过案例分析熟悉故障分析和处理的技巧。 教学目标
根据项目分解要求,项目维护B组要及时对M县新建智能光城域网络运行过程中出现的故障进行处理,确保网络在出现故障之后能够迅速、准确的定位故障点,并排除故障,恢复网络的正常运行。 任务描述
通过对本任务进行分析,项目维护B组要能顺利完成M县新建智能光城域网络故障处理任务,需要积累故障分析和处理的经验以备不时之需,因此完成以下工作: 常见故障案例分析 任务分析
查看 维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重程度、危害程度。 询问 询问相关操作人员,是否有直接原因导致此故障。查询清楚设备的历史操作,历史告警等。 思考 根据现场查看的故障现象和询问的结果,结合自己的知识进行分析,进行故障定位,判断故障点和故障原因。 动手 根据前三个步骤,采取相应的操作解决、排除故障,例如修改配置数据,更换单板等。 必备知识—9.1故障处理的基本原则
必备知识—9.2故障处理流程 发现故障、出现告警 通知相关人员进行故障处理 否 通知中兴通讯办事处 能否处理故障 ? 办事处电话处理故障 能 否 办事处派人 现场处理 能否处理故障 ? 能 填写故障处理报告 故障处理流程1(办事规程)
必备知识—9.2故障处理流程 故障处理流程2(故障处理)
必备知识—9.3故障原因分析 • 工程问题 由于工程施工不规范、工程质量差等原因造成的设备故障。 • 外部原因 供电电源故障(如设备掉电、供电电压过低等) 交换机故障 光纤故障(光纤性能劣化、损耗过高,或光纤损断,光纤接头接触不良) 中继电缆脱落、损坏或接触不良 设备接地不良 设备周围环境劣化 • 操作不当 维护人员对产品了解不够深入所导致( 现场改网、扩容、新老设备混用、新老版本混 用、升级、使用新版本的备板、使用一些未经系统联调的板件) • 设备对接问题 在线缆连接错误 设备接地问题 传输、交换网络之间时钟同步问题 SDH帧结构中开销字节的定义不同 • 设备原因 设备自然损坏或板件的配合问题
必备知识—9.4故障定位 • 故障定位基本原则 • 先排除外部原因,然后到传输 • 先定位故障到单站,然后到单板 • 先排除线路问题,然后到支路 作为故障处理人员,须熟悉设备系统,掌握SDH原理及信号流程,熟悉组网结构,以及掌握维护的基本操作。
观察分析法 检查设备指示灯,获取告警信息。 通过在网管上观察告警以及性能数据,收集故障信息。 对关键的告警以及性能信息进行分析,分析故障原因。 通过告警信号流等知识,定位故障到单站。 必备知识—9.4故障定位 • 检查网元运行的时间是否和网管计算机时间同步,如果不同步则有可能导致产生错误的告警信息。
测试法 当组网、业务和故障信息相当复杂时,或者设备没有出现明显的告警和性能信息上报时,可以利用网管提供的维护功能进行测试,判断故障点和故障类型 最常用的测试方法是环回,环回的基本步骤包括有: 选择故障站点。 从故障站点中选择一条受影响的业务时隙。 详细地画出该业务路径图。 逐段进行环回,定位故障到单站,乃至单板。 必备知识—9.4故障定位 3-OL4 6-OL4 3-OL4 6-OL4 AU4-1: # 5 TU12 AU4-1: # 5 TU12 A B C 1-ET1: 端口 1 1-ET1: 端口 5
拔插法 最初发现某种电路板故障时,通过插拔一下电路板和外部接口插头的方法,排除因接触不良或处理机异常的故障。 在插拔过程中,应严格遵循单板插拔的操作规范。否则可能导致板件损坏等其它问题的发生。 必备知识—9.4故障定位
替换法 替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段线缆、一块单板或一端设备 替换法常用于以下情况: 排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等 故障定位到单站后,排除单站内单板的问题 解决电源、接地问题 采用替换法,一般都要求有备件 必备知识—9.4故障定位
配置数据分析法 配置数据分析法主要用于解决由于设备配置变更或维护人员的误操作导致的故障。常见的情况有: 时隙配置问题。 开销字节设置问题(J1、C2等) 复用段参数设置问题(APS ID 等) 维护操作原因(环回,告警插入等) 网管和网元配置数据不一致原因 配置数据分析法一般要求维护人员具备较丰富的经验和知识 必备知识—9.4故障定位
更改配置法 更改配置法是通过更改设备配置来定位故障的方法,操作起来比较复杂,对维护人员的要求较高,因此一般用于在没有备板的情况下临时恢复业务,或用于定位指针调整问题 更改配置法常用于下面情况: 定位指针调整问题时,更改时钟源配置和时钟抽取方向进行定位 如果怀疑支路板的某些通道或某一块支路板有问题,可以将时隙配置到另外的通道或另一支路板。如果怀疑背板某个槽位有问题,可以通过更改板位配置进行排除 必备知识—9.4故障定位 • 更改设备配置之前,应备份原有配置,同时详细记录所进行的操作,以便于故障定位和数据恢复。
仪表测试法 仪表测试法是指利用仪表定量测试设备的工作参数,一般用于排除传输设备外部问题以及与其他设备的对接问题 仪表测试法常用于以下情况: 如怀疑电源供电电压过高或过低,可以用万用表进行测试 如传输设备与其他设备无法对接,怀疑设备接地不良,可以用万用表测量通道发端信号地和收端信号地之间的电压值 如传输设备与其他设备无法对接,怀疑接口信号不兼容,可以通过信号分析仪表观察帧信号是否正常,开销字节是否正常,是否有异常告警,进而判断故障原因 通过仪表测试法分析定位故障比较准确,可信度高,但是对仪表有需求,同时对维护人员的要求也比较高 必备知识—9.4故障定位
经验处理法 在一些特殊的情况下,由于瞬间供电异常、外部强烈的电磁干扰等,致使设备单板进入异常工作状态,发生业务中断、ECC通信中断等故障,此时设备的配置数据完全正常,在这种情况下通过复位等操作重新恢复业务 常用的经验处理方法有: 复位单板 插拔单板 重新下发数据 掉电重启 必备知识—9.4故障定位 • 此类方法不利于故障的彻底清除,只用于紧急情况,业务恢复并非意味着故障已消除,设备可能依然存在隐患。
故障原因 传输设备侧或交换机侧故障导致通信业务中断或者大量误码产生。 处理流程 发生故障 启用备用通道 故障定界和定性 协调交换班组处理 发生传输故障 执行传输故障流程 通过网管分析进行故障分类 业务中断类故障处理流程 误码类故障处理流程 时钟同步类故障处理流程 必备知识—9.5故障分类 9.5.1通信故障 测试法(环回、误码测试) 传输故障分类
故障原因 外部原因:供电电源故障;光纤、电缆故障等。 操作不当:误操作,设置了光路或支路通道的环回,更改、删除了配置数据。 设备原因:单板失效或性能劣化。 处理流程 在本端网元选择故障通道中的支路收发端口接入误码仪,采用测试法逐级环回,定位故障网元。 观察设备指示灯的运行情况,分析设备故障。 分析网管告警和性能,定位故障。 必备知识—9.5故障分类 9.5.2业务中断故障
①高阶通道、管理单元环回原则 依次从本端网元的故障光方向做故障AU的终端侧环回、临近网元的近端光路故障AU的线路侧环回、临近网元的远端光路故障AU的终端侧环回、次临近网元的近端光路故障AU的线路侧环回、次临近网元的远端光路故障AU的终端侧环回、……末端网元的近端光路故障AU的线路侧环回、末端网元的对应支路的线路侧环回。 ②低阶通道环回原则 依次将本端该支路时隙在临近网元、次临近网元、……末端网元的光路时隙直通配置更改为时隙下支路。 从临近网元新配的支路做线路侧环回、次临近网元新配的支路做线路侧环回、……末端网元的对应支路做线路侧环回。 远端 远端 近端 近端 近端 本端 网元 临近 网元 次临近 网元 末端 网元 必备知识—9.5故障分类 9.5.2业务中断故障
故障原因 外部原因:光纤接头不清洁或连接不正确;光纤性能劣化、损耗过高;设备接地不好;设备附近有干扰源;设备散热不好,工作温度过高。 设备原因:交叉时钟板与线路板、支路板配合不好;时钟同步性能不好;单板失效或性能不好等。 处理流程 采用测试法定位误码的发源地。 ①检查光线路板收发光功率是否在指标内。(发光功率正常,但收光功率低于接收灵敏度或没有光输入,应检查光线路板收口到ODF尾纤连接和耦合情况) ②若两端ODF上的接收光功率都偏低或收无光,说明光缆线路有问题。(通过尾纤自环光线路板输入输出来定位是本端网元光口故障还是对端网元光口故障) ③自环本光线路板后,没有再上报B1/B2性能,说明本光线路板无故障。自环对端光线路板后,对端光线路板也没有再上报B1/B2性能,说明对端光线路板无故障。 必备知识—9.5故障分类 9.5.3误码类故障
处理流程 如果是光线路板误码,分析光线路板误码性能事件,排除线路误码。 ①排除外部的故障原因 ②观察光线路板误码情况。(若某站所有线路板都有误码,推断为该站交叉时钟板问题,更换交叉时钟板。若只有某块线路板报误码,则可能是线路板问题,或对端线路板,或光纤的问题) 如果是支路板误码,分析支路板误码性能事件,排除支路误码。(若只有支路误码,则可能是支路板或交叉时钟板的问题,应更换支路板或交叉时钟板) 必备知识—9.5故障分类 9.5.3误码类故障
故障原因 外部原因:光纤接反;外时钟质量问题。 操作不当:时钟源配置错误,出现一个子网中同时有两个时钟源的情况;时钟源级别设置错误;时钟对抽。 设备问题:线路板故障,提供的线路时钟质量不好;交叉时钟板故障,提供的时钟源质量不好;交叉时钟板故障,给各单板分配的工作时钟质量不好。 处理流程 检查网管的时钟配置,避免时钟对抽等人为的错误操作,并将正确的时钟配置下发至NCP板,保持网管数据与NCP数据的一致。 通过网管检查光路和支路是否有AU PJE/TU PJE的性能值。如果只有TU PJE(指针调整事件),说明该支路板故障,更换即可。 必备知识—9.5故障分类 9.5.4时钟同步类故障
处理流程 如果AU PJE/TU PJE同时存在,先处理AU PJE,处理后如果还有TU PJE,继续处理TU PJE。产生AU PJE的单板有光线路板和交叉时钟板。 ①检查收光功率,并查询B1/B2性能值。如果收光功率正常,光线路板B1/B2性能值为0,说明AU PJE来源于网元设备内部。 ②检查交叉时钟板对时钟的锁定情况。如果时钟不能锁定,可以通过网管操作倒换交叉时钟板。 ③如果倒换后时钟锁定并AU PJE消除,更换原主用交叉时钟板。 ④如果倒换后时钟仍不能锁定并同样伴随AU PJE,更改时钟提取光方向。如果AU PJE消除,说明原光线路板光接口或对端光接口故障。 必备知识—9.5故障分类 9.5.4时钟同步类故障
故障原因 外部原因:供电电源故障,光纤故障。 操作不当:网关连接配置有误。 设备故障:网卡故障、光线路板故障、交叉时钟板故障、网元有大量的性能数据上报到网管,造成ECC通道阻塞等。 处理流程 排除外部原因,如掉电、光纤性能劣化等。 检查网管配置是否有误。 采用测试法,逐段自环定位故障网元。 采用观察分析法对光线路板、交叉时钟板进行检查。 必备知识—9.5故障分类 9.5.5网管连接故障
故障原因 外部原因:掉电、光纤折断等。 操作不当:公务板(OW)、光线路板配置错误。 设备原因:光线路板、OW板故障。 处理流程 检查光路是否有告警。因为光路不通,公务也不能通。 检查公务电话是否出现故障,可更换电话测试。 检查OW板,观察指示灯及网管告警,可采用拔插法、替换法确定公务板是否产生故障。 检查OW板、光线路板的配置。 必备知识—9.5故障分类 9.5.6公务故障
故障原因 外部原因:电源故障,如设备掉电;线缆故障,如断纤、网线错连、错用交叉网线和直连网线等。 操作不当:以太网配置错误,如未启用端口、VLAN配置错误等。 设备故障:光板故障、SFE4板故障。 处理流程 排除外部原因,如掉电、断纤、网线未正常连接等。 采用配置数据分析法检查网管中以太网板配置是否有误。 采用替换法,使用正常的单板替换故障单板。 必备知识—9.5故障分类 9.5.7以太网业务故障
故障原因 光纤或电缆错连。 与其他厂商提供的设备对接时,一方设备接地有问题,或双方设备不共地。 传输、交换各自的网络内部时钟同步,但两个网络之间不同步。 各厂家SDH帧结构中开销字节的定义不同。 处理流程 检查设备间物理连接的正确性,防止电缆的漏焊、虚焊、接触不良。 检查对接设备两侧的告警和性能,以帮助定位故障。 检查双方设备的接地和共地情况。 检查同轴端口的屏蔽层接地情况。 检查全网的时钟同步。 检查对接设备的SDH帧结构中开销字节的定义是否不同。 必备知识—9.5故障分类 9.5.8设备对接故障
任务实施—9.6案例分析 9.6.1光功率过弱导致B1误码 • 系统概述 • 某局本地传输网由6端网元组成,构成一个通道保护环结构,传输速率为622Mbit/s,中心局设在A网元。A网元的4#04CSD的l号端口接B网元4#04CSD的2号端口。各网元间跟中心点A网元都有2M业务。 • 故障现象 • 从网管上查询监视的性能数据,在A站发现该站4#04CSD端口1线路上有每15分钟性能有大量Bl BBE,B2 BBE,B3 BBE误码。检查B站,发现该站的4#04CSD端口2有B2 FEBBE,B3 FEBBE误码。支路无误码。 4#2 4#l A B C F E D
任务实施—9.6案例分析 9.6.1光功率过弱导致B1误码 • 故障分析 • Bl字节测两站再生段间的路由,B2字节监测两站复用段之间的路由,B3监测两站间某高阶通道间的路由。B3监测的路由包括B2和Bl监测的路由,而B2监测的路由包括B1监测的路由。 • 同一AU业务在B、C两点都下业务,A、B两点产生的B3不会下传到C点。 • 支路无误码是因为支路板收的是另一方向。 • 从数据误码分析误码产生是A、B两点之间。 • 故障处理 • 测量A点收B点的光功率,发现光功率为-33.5db,而04CSD板接收灵敏度为-28db,光功率过低。 • 在A点配线架处测量光功率也为-33db,说明尾纤无问题。 • 在B点配线架处测量发光功率为-17db,将B点光口尾纤清洁,插好,在B点配线架处测量为-10db。 • A点收光-25db。然后查询性能,误码消失,问题解决。
7#1 7#2 7#1 7#2 A B C 任务实施—9.6案例分析 9.6.2 PWA板导致业务出现瞬断 • 系统概述 • 某局本地传输网由3端网元组成,构成一个无保护链结构,传输速率为155Mbit/s,中心局设在A网元。A网元的7#OIB1-l接B网元7#OIBl-2,B网元的7#OIBl-1接C网元7#OIB1-2。各网元间都有2M业务。 • 故障现象 • 从网管上发现B与C网元出现业务中断,大概几分钟后业务又恢复。同时在A网元的7#OIBl-1与C网元的7#OIB1-2出现OFS(帧失步秒)告警,2M业务出现AIS(告警指示信号)及UAS(通道不可用)告警。
任务实施—9.6案例分析 9.6.2 PWA板导致业务出现瞬断 • 故障分析 • 先定位故障网元。由于A网元的7#OIBl-1与C网元的7#OIB1-2同时出现OFS告警, • 由于A、C网元出现故障导致业务不通的可能性很小。因此基本可以排除A与C网元的故障,把故障定位在B网元。 • 对于B网元导致该现象可能是由于该网元的交叉板,时钟板,电源板及7# OIB1板。 • 故障处理 • 倒换交叉板及时钟板,故障依旧。 • 更换7# OIB1板,在更换时发现,在插板时所有的单板都出现复位现象。 • 怀疑电源板的供电电路出现问题或者背板总线出现故障。 • 更换电源板后,故障消失。
5#1 5#2 5#1 5#2 A B C 5#2 5#1 5#2 5#1 F E D 5#2 5#1 5#2 5#1 任务实施—9.6案例分析 9.6.3时钟板报定时输入丢失 • 系统概述 • 某局本地传输网由6端网元组成,构成一个通道保护环结构,传输速率为155Mbit/s,中心局设在A网元。 • 故障现象 • B点时钟源配置为抽线路时钟,但B点时钟板始终报输入定时源丢失,取当前定时源为内时钟。B点两端光板性能正常,业务正常。
任务实施—9.6案例分析 9.6.3时钟板报定时输入丢失 • 故障分析 • 时钟板报定时输入丢失,引起本点为内时钟。所以先要解决时钟源丢失的问题。此问题一般是光路问题引起,或者光板,时钟板有问题。 • 故障处理 • 查询光路性能,性能为零,说明光路正常。 • 可能由于板件原因,将备板OIB1板插在设备上,故障消失。
4# 4# A 5# B 5# C 4# 4# 5# 5# F E D 5# 4# 5# 4# 任务实施—9.6案例分析 9.6.4通道环倒换不成功 • 系统概述 • 某局本地传输网由6端网元组成,构成通道保护环结构,传输速率为155Mbit/s,中心局设在A网元。AUG2业务在B、C点下,F、E、D点配置为AUG直通。 • 故障现象 • 断A点到F点光纤,业务正常。断A点到B点光纤B、C点AUG2业务断。
任务实施—9.6案例分析 9.6.4通道环倒换不成功 • 故障分析 • 检查时隙发现AUG2在F、E、D点配置为AUG直通,04CS板,硬件版本b010902不支持AUG直通,硬件版本b020600支持AUG直通。所以先要查看硬件版本是否正确。 • 故障处理 • 检查版本发现全网硬件版本都为b020600,应该无问题。 • 其余直通AUG是好的,只有AUG2有问题。 • 通过环回定位发现从E点AUG2就有问题。 • 将E点时隙删除,再配上,下发,解决不掉故障,复位04CS不起作用。 • 将E点AUG2配置成TU12直通后解决。
系统概述 某局本地传输网由4端网元组成,A、B、C在环上,采用通道保护环组网,B点带几条支链。 A B C D 任务实施—9.6案例分析 9.6.5时分不够引起的问题 • 故障现象 • 新加的D点和D点后面站点的支链业务,所有2M业务告远端缺陷。
故障分析 这是通道保护问题,环回或配区间业务即可通。 任务实施—9.6案例分析 9.6.5时分不够引起的问题 • 故障处理 • 现只配置A-B-D 2M业务,业务通,没有问题。 • 再只配置C-B-D业务,业务仍然通,没有问题。 • 定位到B点的交叉板,倒换交叉板,配置保护到D,业务仍然不通。 • 分析B点时分情况,实际业务所需时分已经大于其交叉能力,只是下发时隙没有提示时分资源不够。 • 将CSBZ更改为CSBE,问题解决。
测试评估 • 任务引导问题: • 完成《学生学习指导手册》任务引导问题。 • 任务实施单: • 作好展示汇报任务实施情况(故障处理案例分析)的准备。(相关材料存档) • 完成《学生学习指导手册》任务实施单内容。 • 学生评价: • 完成《学生学习指导手册》中学生自评。 • 小组评价: • 完成《学生学习指导手册》中组长评价。 • 教师评价: • 教师根据材料和汇报、答辩等情况评定成绩。