160 likes | 317 Views
6 WCDMA 接入网设备运行维护. 6.2 典型故障处理. 主讲人:许鹏飞. 故障的分类: 加载类故障 , 指系统在主机系统加载时出现的故障。 接口链路类故障 , 指主机系统与其它设备(如 NodeB , CN 设备)的连接通路出现的故障。 业务类故障 , 指系统不能执行 UMTS 业务的相关故障。根据故障产生的现象,业务类故障又将其分成小区类、接入类、电路域业务类、分组域业务类故障; 操作维护类故障 , 指 BAM 、 LMT 等操作维护设备出现的故障。. 1 、故障处理概述( 1 ). 故障处理的一般流程:
E N D
6 WCDMA接入网设备运行维护 6.2 典型故障处理 主讲人:许鹏飞
故障的分类: 加载类故障,指系统在主机系统加载时出现的故障。 接口链路类故障,指主机系统与其它设备(如NodeB,CN设备)的连接通路出现的故障。 业务类故障,指系统不能执行UMTS业务的相关故障。根据故障产生的现象,业务类故障又将其分成小区类、接入类、电路域业务类、分组域业务类故障; 操作维护类故障,指BAM、LMT等操作维护设备出现的故障。 1、故障处理概述(1)
故障处理的一般流程: 信息收集:在处理故障前,一般需要收集必要的故障信息 ; 故障判断:在获取故障信息后,需要对故障现象有一个大致的定义,以确定故障的范围与种类; 故障定位:故障定位是“从众多可能原因中找出故障原因”的过程; 故障排除:故障排除是指采取适当的措施或步骤清除故障、恢复系统的过程。如检修线路、更换单板、修改配置数据、倒换系统、复位单板等。 1、故障处理概述(2)
信息收集的内容: 告警信息 主机错误日志 BAM错误日志 维护台操作日志 自诊断输出信息 单用户的CDR(呼叫数据记录)信息 标准接口信令跟踪消息 数据配置信息 1、故障处理概述(3)
故障定位的常用手段: 查看告警、指示灯和错误提示 接口和协议跟踪 业务演示辅助分析 仪器、仪表辅助分析 性能测量辅助分析 测试辅助分析 对比/互换 主备倒换/复位 1、故障处理概述(4)
现象描述: 某WCDMA-RNC新开局,采用BSC6810V200R011C00SPC100版本,双OMU。在此为了简要说明,用OMU1和OMU2代表。初始 均可正常通信,但从某一次起,OMU2无法通信,现象为ETH0、ETH1和ETH2口均ping不通。面板上RUN指示灯正常闪烁(1S),OFF灯正 常长灭,网口显示link状态。OMU1可进行正常通信及软调,配置为Dual模式软调后在设备面板上只能看到一块OMU1,另一块(OMU2)的槽位为空。 2、典型故障分析案例-操作维护类(1)
原因分析: 便携机IP设置与OMU2的网卡地址不匹配。 OMU2中操作系统损坏。 Windows防火墙阻止了网口的通信。 OMU2单板硬件故障。 2、典型故障分析案例-操作维护类(2)
处理过程: 1、检查便携机IP设置,之前有成功登录过OMU2并修改过外网IP和虚拟IP为规划值,同时修改过ETH2地址为196.168.6.50,所 以便携机设置应与之保持一致,检查是无误的。但是现在不能与之通信,ETH2也ping不通,所以无从考证OMU2中外网IP、虚拟IP及ETH2是否成 功设置。因此无法判定便携机IP与网卡地址是否匹配。 2、典型故障分析案例-操作维护类(3)
处理过程: 2、通过COM口检查OMU2中操作系统是否损坏 用串口线连接OMU面板上的COM口与便携机,启用超级终端。发现可以正常进入到BIOS,但无法成功启动Windows,怀疑操作系统损坏。现场找来随设备配发的系统盘(内有Easy Install、SP2、SetWin等必备软件)尝试重装系统。但是当安装到“6.5 运行EasyInstall软件”中的“步骤5 输入install.bat,回车执行脚本直至命令行跳回‘D:\autoinst’时发现无法成功,提示 “Not found Eth2 in system”。怀疑是因为ETH2无法通信,ping不通导致无法进行系统重装。 问题仍然无法解决。 2、典型故障分析案例-操作维护类(4)
处理过程: 3、通过VGA口检查OMU2中操作系统是否损坏 现场借来显示器与USB口鼠标键盘,接入OMU面板上VGA口与USB口,直接登录OMU2。发现成功登录并启动Windows系统。至此说明系统并未损坏。 4、检查IP设置与防火墙设置 检查网络连接中的ETH0、ETH1和ETH2与外网虚拟IP设置,发现与规划一致,说明已成功设置。检查发现Windows防火墙开启。询问最后一次登录 时的操作即是开启防火墙,怀疑防火墙的某些设置禁掉了网口。关闭防火墙后,尝试用ETH口与OMU2相连,发现通信完全正常,至此问题解决。 2、典型故障分析案例-操作维护类(5)
建议与总结: 由于与OMU完全没有通信,所以无法定位故障。建议: 现场再出现这种无法通信的问题,找来外接显示器定位是否操作系统问题并查看BAM的IP及防火墙设置。 没有特殊情况,不要随意打开Windows防火墙,以免这类问题再发生。 2、典型故障分析案例-操作维护类(6)
故障现象: 配置完成后,检查PS的目的信令点不可用,继续检查发现SAALLNK闪断,大多时候是可用的。 故障处理: 根据以前案例分析,一般闪断是因为一些次重要的小参数设置有误,于是对PS端口的配置进行检查,发现在添加MTP3BLNK时它的SLC号与协商数据不对应。结合MTP3链路消息跟踪,发现本端和对端的SLC不一致。 2、典型故障分析案例-数据配置类(1)
处理结果: 在修改本端SLC配置后,SAALLNK不再闪断,MTP3链路稳定,PS的目的信令点也可用了。 经验总结: 在先前配置数据时,因为IUB端的ID都根据个人喜好由自己编写,只要与NODEB对应即可,比如SAALLNK的编号,所以在PS域配置时忘了必须与CN对应,而按照自己的习惯将MTP3BLNK的编号随便写上,造成错误。后续需要注意数据配置规范。 2、典型故障分析案例-数据配置类(2)
故障现象: 本地小区可用,逻辑小区不可建立,DSP CELL小区没起来,原因显示power mismatch。 告警信息: 小区建立失败 原因分析: 首先LST CELL看参数是否和协商数据有错。 确认没错后跟踪IUB小区建立的信令,查看NBAP_CELL_SET_UP_FAILURE的小区建立失败原因,显示power mismatch。 2、典型故障分析案例-数据配置类(3)
原因分析: 于是检查RNC侧和NODEB的功率设置问题,查看NODEB的功率,突然想到小区建立前有资源审计信令,于是跟踪IUB口的NBAP_AUDIT_RSP查看NODEB承受的最大发射功率。检查中发现NBAP_AUDIT_RSP有如下信息: 167>....................maximumDL-PowerCapability:0xf0 (240) 168> ......................minSpreadingFactor:v4 (0) 169> 170>......................minimumDL-PowerCapability:0x32 (50) 可以发现NODEB承载的最大发射功率大小有范围要求即5-24dbm,而我们查看RNC侧的功率设置的时候,默认为43dbm。 2、典型故障分析案例-数据配置类(4)
处理过程: MOD CELL将最大发射功率设置为24dbm,小区即可正常建立。 建议与总结: 由于是本地小区不可用,逻辑小区建立不起来,所以NODEB自身没故障,于是查找RNC侧原因。 功率参数设置要根据实际情况设置,由于当时我们小组的NODEB是连接的PRRU,所以功率设置和默认的不匹配,LMT默认的是MRRU的最大发射功率。 错误要正确定位,跟踪信令和查看信令是最可靠、最省时间的方法。 2、典型故障分析案例-数据配置类(5)