故障排查需要重点解决的是协议协商、成员口状态、流量异常三类典型问题。
首先考虑设计分层诊断方案:协议层用display lacp相关命令,成员口状态层用display eth-trunk,流量层用统计和转发表命令。这样符合实际排错流程。每个层级需要给出命令示例和关键输出解读,比如verbose模式输出的PortState字段对判断LACP协商特别重要。
然后用户可能遇到最头痛的是“假UP”问题(聚合组UP但业务不通),其实这是常见故障。需要重点解释display eth-trunk里Unselected状态的含义,以及如何通过lacp statistics确认协议报文收发是否正常。比如LacpRevPdu为0肯定说明协商失败。
另外负载不均问题也有发生,hash策略不一致会导致单向不通,使用display trunkfwdtbl命令能验证哈希分配。这个点在很多工程师容易忽略,应该加入典型案例说明。
最后要提醒安全注意事项:比如display eth-trunk不加trunk-id可能引发设备无响应,这种实战细节容易忽略。
以下是基于华为设备的链路聚合故障快速定位方法及命令解析,结合关键诊断命令和输出解读,帮助高效排查常见问题:
一、协议协商故障排查(LACP未生效)
故障现象
Eth-Trunk状态为UP,但业务不通,成员口显示Unselected或Down。
诊断命令与输出解析:
1.检查LACP邻居状态
display lacp peer eth-trunk 1
异常输出:No peer information(对端未开启LACP)
正常输出:显示对端系统ID、优先级及端口状态
Partner:
System Priority: 32768, System ID: 00e0-fc12-3460
Port Status
GE0/0/1 Selected # 协商成功
2.验证LACP报文收发
display lacp statistics eth-trunk 1
关键字段:
LacpRevPdu=0:未收到对端LACP报文(防火墙拦截或模式不一致)
LacpSentPdu>0但无回复:对端未启用LACP或物理链路故障。
Port LacpRevPdu LacpSentPdu
GE0/0/1 0 1500 # 接收为0,需检查对端配置
二、成员口状态异常(参数不一致)
故障现象
部分成员口被踢出聚合组,显示Unselect或Down。
诊断命令与输出解析:
1.查看成员口详细状态
display eth-trunk 1 verbose
关键字段解读:
PortName Status PortState Weight
GE0/0/1 Unselect 10100000 1 # PortState二进制解析:
第3位=0 → 接口未被聚合组选中
第5位=0 → 接口不能接收数据
故障原因:端口参数(速率、双工、VLAN)不一致导致端口被抑制
2.检查端口基础配置
display interface GigabitEthernet 0/0/1
输出对比点:
Speed(速率)、Duplex(双工模式)、PVID(VLAN)需完全相同
三、流量负载不均或黑洞链路
故障现象
部分业务延迟高,或特定IP流量不通。
诊断命令与输出解析:
1.检查流量分布
display eth-trunk 1 statistics
异常现象:某成员口流量始终为0
Port Last 300s Input Rate (bps)
GE0/0/1 0 # 黑洞链路
GE0/0/2 950,000
原因:Hash策略不一致或物理链路故障
2.验证Hash策略一致性
display eth-trunk 1 # 查看负载均衡算法
输出字段:Hash arithmetic: According to src-dst-ip
解决:两端统一策略(如load-balance src-dst-ip)
3.检测转发路径
display trunkfwdtbl eth-trunk 1
输出示例:
HashKey 0 → GE0/0/1
HashKey 1 → GE0/0/1 # 所有流量指向同一端口(需调整Hash算法)
四、高级故障场景排查
1.STP干扰导致环路
现象:MAC地址频繁震荡,日志报MAC flapping
命令:
display stp brief # 检查聚合口是否被阻塞
display logbuffer # 查看MAC振荡日志[3](@ref)
解决:聚合口下执行stp disable
活动链路数不足
display eth-trunk 1 | include “Active-linknumber”
输出:Least Active-linknumber: 2(实际Up链路<2时Eth-Trunk宕机)
诊断流程图与预防建议
预防性维护:
1.配置前统一两端参数:speed 1000, duplex full, port trunk allow-pass vlan xx
2.启用抢占延迟:lacp preempt enable(避免端口频繁切换)
3.定期检查:display eth-trunk summary(监控聚合组健康状态)。
通过上述命令组合,可覆盖90%链路聚合故障场景,重点排查 协议一致性、参数匹配、流量哈希三大核心问题。
暂无评论内容