故障现象
两台ZXR10 5960X做堆叠,与对端服务器直连起动态的链路聚合,链路聚合无法成功。
版本:5900X V6.00.00.71P30
故障分析
产生上述现象的可能原因有:物理链路问题。交换机配置或是设备问题。服务器配置或是设备问题。
故障处理
1. 检查ZXR10 5960X与服务器两侧的接口状态都为up,为了防止堆叠SmartGroup中两条链路互相干扰,down掉了一条链路,只留一条链路,链路状态依然为INACTIVE。
2. 检查ZXR10 5960X的配置,未发现问题。
3. 检查接口LACP报文的收发情况,有收有发,计数都在增长。
4. 通过debug命令查看LACP报文收发的具体情况。
5. 把上述报文导入到抓包软件中查看报文的具体内容,发现服务器发送的LACP 状态信息一直不正确。如图1所示,Synchronization为0,表示端口没有选择正确的聚合组。
图1 LACP状态信息Synchronization为0
而5960X发送的LACP报文状态是正确的,Synchronization为1,如图2所示。
图2 LACP状态信息Synchronization为1
6. 将相关信息通知到服务器侧维护人员,服务器修改设置后聚合成功。
故障总结
LACP 状态中各个值的含义:
LACP_Activity:0表示PASSIVE,1表示ACTIVE。
LACP_timeout:0表示长超时,1表示短超时。
Aggregation:0表示链路不可聚合,1表示链路可以聚合。
Synchronization:0表示端口没有选择正确聚合组,1表示端口分配到聚合端组中。
Collecting:0表示当前链路收包为false,1表示当前链路收包为enable,协商成功后是1。
Distributing:0表示当前链路发包为false,1表示当前链路发包为enable,协商成功后是1。
Defaulted:0表示发送方报文中Partner部分值来自LACP PDU(LACP协议数据单元),1表示发送方报文中Partner部分值来自默认值。
Expired:0表示没有超时,1表示收包超时。