故障现象
随着5G网络的快速部署,SA网络已逐步实现商用,随着日常SA用户的不断增加,相关网络指标的监控已成为5G网络日常重点工作,通过指标观测及时发现潜在问题点,以保障用户良好的网络使用体验。目前,SA接通率有RRC建立、QoSflow、NG建立三部分决定,其中任何指标出现问题,接通率均存在恶化风险。通过前期的SA指标监控,对其存在的问题进行分析与解决,并将其处理经验进行了总结,通过本案例以希望为后期优化提供一定的参考价值。
故障分析
故障分析流程如图1所示。
图1 故障分析流程图Counter分析
Counter分析受限需要对问题进行定界,优先判断是否存在核心网问题和传输问题,若存在问题,需联合核心网和传输侧共同分析,待上层问题排除后再观察指标是否恢复。若没有恢复再继续分析无线侧问题。Counter分析主要从以下4个方面着手。
RRC建立失败原因分析
RRC建立成功率=RRC建立成功次数/RRC建立请求次数(包含重发)
网管定义了以下几种RRC建立失败原因:
小区中RRC建立请求拒绝的次数:Gnb收到Msg3后,需要为终端分配无线资源,SRB1资源等,当出现分配失败时,则会回复RRCConnectionReject。
RRC建立失败常见原因:
小区中由于UE无应答导致RRC建立失败的次数:Gnb下发Msg4后,一直未收到终端上发的Msg5。UE无应答导致的RRC建立失败绝大多数是由于弱覆盖或干扰引起的,可以通过RF优化,干扰处理解决。
小区中由于流控导致的RRC建立请求消息丢弃的次数:当CPU负荷过高时,为防止系统崩溃,会启动流控,限制用户接入。CPU负荷过高,主要由于基站负荷过高导致,需要及时处理高负荷问题,另外寻呼风暴&信令风暴等问题也会导致CPU负荷增高,需要额外关注。
网管侧可以统计到小区中因资源分配失败导致RRC建立拒绝的次数的counter。
NG口SIG建立失败原因分析
对于NG口信令建立失败,网管未定义失败counter,通常有以下几种原因:
核心网原因:AMF收到Initial UE Message后不回复或直接将终端释放,此种情况需要联合核心网排查。
基站问题:Gnb收到Msg5后处理异常,没有上发Initial UE Message,此种情况需结合具体信令消息进行定位。
传输问题:NG口SIG建立或上下文建立流程中,出现传输中断导致流程失败,此种情况需要联合传输处理。
NAS过程异常:NAS过程异常,AMF主动释放或AMF不发送上下文建立请求或Gnb释放,此种建议联合核心网排查。
上下文建立失败原因分析
网管定义了以下上下文建立失败原因:
无线层原因导致的UE上下文建立失败:空口问题,通常由弱覆盖或干扰导致,可以通过RF优化与干扰排查处理。
无线资源不足导致的UE上下文建立失败:通常由高负荷引起,需要及时处理,如无高负荷问题,需进行单用户信令跟踪定位问题。
UE无响应导致的UE上下文建立失败:同无线层原因。
核心网异常导致的UE上下文建立失败:跟踪信令,查看问题节点后进行处理。
QoSFlow建立失败原因分析
对于QosFlow建立失败,PRS有如下原因值:
UE能力导致的QosFlow建立失败:终端问题,建议提单处理。
传输网络层原因导致的QosFlow建立失败:联合传输排查。
核心网原因导致的QosFlow建立失败:联合核心网排查。
无线网络层原因导致的QosFlow建立失败:空口原因,通过RF优化与干扰排查处理。
故障处理
硬件故障
硬件故障首先要识别断站、退服和影响业务的故障,并梳理出相应的故障目录。并对故障发生时间和恢复时间与指标劣化时间点进行匹配,若存在强相关性,才认为该硬件故障是导致指标劣化的主要因素。一旦明确其相关性,需尽快推动维护尽快处理。5G影响业务和退服类告警清单梳理常见表1。
干扰排查
对采集的干扰话统,计算时间特征、频域特征、符号时域特征、空域特征,通过特征提取、聚类可得出对干扰特征的推断。时间上每天统计8~22点15忙时按算术平均,任何一天干扰大于门限值(默认-107dBm/PRB)认为干扰小区。
NR邻区终端干扰
相邻同频小区上行PRB分配碰撞带来的干扰如图2所示。
图2 NR邻区终端干扰
屏蔽器干扰
信号屏蔽器通过发射无用功率对基站的干扰,常见于学校、政企、监狱等,如图3所示。
图3 屏蔽器干扰
建议从组内最强小区开始外部干扰排查,重点排查周边的学校、政企、监狱等单位,学校、政企等短时间使用的建议协调“用完就关”,监狱等长期开启类建议推动更换“只干扰下行”的屏蔽器
外部干扰
外部干扰一般呈现出区域相关性,此处定义的外部干扰可能是非已知的外部干扰源,需要外出用频谱分析仪进行干扰源定位建议从组内最强小区开始外部干扰排查,根据干扰特征,使用三点定位法定位干扰源位置。
伪基站干扰
公安等的仿真基站设备与运营商基站帧头未对齐的干扰,如图4所示。
图4 伪基站干扰
建议从组内最强小区开始外部干扰排查,重点排查路边、重要路口的路灯杆等上的射频设备,建议推动修改帧头与运营商对齐。
覆盖优化
覆盖优化一般优先考虑现场RF优化,再考虑波束优化。覆盖优化需建立在经纬度、方位角、机/电倾角准确的基础上。主要采取功率整治和波束调优两种手段。
功率整治
总体原则:功率配置过高,对下行速率有增益,但由于终端上行发射功率受限,会导致上行下不平衡。功率配置偏低,不利于话务吸收,分流效果较差。现按照厂家功率建议进行功率规整。
波束调优
波束调优主要采用RF调整和Pattern寻优相结合的方式,使小区覆盖最大程度合理化。具体优化手段如下:
5GNR广播信号引入调制参考信号,通过窄波束轮询扫描,多个广播窄波束组合成不同覆盖范围,相比LTE宽波束,增益有~9dB的提升。
5GNR广播波束最大支持17种波束场景。根据宏微站产品规格能力,并综合4/5G网络需求,结合路测及ACP自动调优平台,智能输出RF优化方案。
容量优化
5G目前无容量类问题,若存在个别5G高负荷小区,可参考LTE高负荷的优化方法,优先采取负载均衡措施进行优化。
参数邻区优化
参数优化包括常规基线参数核查和特性参数优化两类。邻区优化主要包括邻区漏配、邻区错配、冗余邻区和PCI混淆等方面。
故障总结
随着日常SA用户的不断增加,为保障用户良好的网络使用体验,相关网络指标的监控已成为5G网络日常重点工作,以便及时发现潜在问题点。通过前期的SA指标监控,发现SA的无线接通率低于正常值,结合定位影响接通指标的原因,给出了接通率的优化思路、分析方法、定位手段,以及优化效果,为后续优化提供一定的参考。