文章目录
前言网络故障描述网络拓扑图故障问题核验一、路由配置核对二、Tracert 路径追踪节点验证测试
三、高时延根源排查1. BRAS 设备核查2. 传输链路核查3. 接入交换机深度排查步骤 1:替代测试验证步骤 2:配置初始化测试步骤 3:下挂配置核查步骤 4:端口状态深度核查
四、故障解决与验证故障原因说明预防措施总结
前言
网络故障排查案例是一个系列,本系列文章将为您揭示:
真实案例:源于日常工作中的典型网络故障。逻辑拆解:运用分层、分组、对比等科学方法梳理排查思路 。实操细节:从故障现象到根因定位,完整呈现处理流程与技巧 。经验沉淀:总结通用排查框架,帮助您在未来工作中快速解决问题。
网络故障描述
新建机房的视频监控设备已成功纳管至云网服务器,但在执行实时点播视频操作时,出现画面明显卡顿、无法流畅播放的异常现象,核心影响视频监控实时预览功能。
网络拓扑图

故障问题核验
视频监控设备可正常纳管至云网服务器,初步判定基础路由连通性正常。通过 PING 测试进一步核验链路质量:
注:36.152.44.93为示例 IP,非真实服务器地址
JianKong>ping 36.152.44.93
正在 Ping 36.152.44.93 具有 32 字节的数据:
来自 36.152.44.93 的回复: 字节=32 时间=500ms TTL=51
来自 36.152.44.93 的回复: 字节=32 时间=1200ms TTL=51
来自 36.152.44.93 的回复: 字节=32 时间=800ms TTL=51
来自 36.152.44.93 的回复: 字节=32 时间=900ms TTL=51
36.152.44.93 的 Ping 统计信息:
数据包: 已发送 = 4,已接收 = 4,丢失 = 0 (0% 丢失),
往返行程的估计时间(以毫秒为单位):
最短 = 500ms,最长 = 1200ms,平均 = 850ms
关键结论:链路无丢包但平均时延达 850ms,远超正常阈值。初步锁定两大排查方向:① 中间路由转发异常;② 中间节点设备故障。
一、路由配置核对
采用分层核查策略,验证各节点路由指向的准确性:
| 核查节点 | 操作命令 | 核查结果 |
|---|---|---|
| 接入交换机 | display ip routing-table X.X.X.X | 下一跳指向 BRAS,配置正常 |
| BRAS 设备 | display ip routing-table 36.152.44.93 | 静态路由指向 192.168.10.2,接口 GE0/0/1 |
| 云网服务器 | 查看路由表 | 反向路由指向监控网段,正常 |
结论:各节点路由下一跳指向均正确,排除路由配置异常导致的故障。
二、Tracert 路径追踪
通过 Tracert 命令定位高时延节点,执行路径追踪操作:
JianKong>tracert 36.152.44.93
通过最多 30 个跃点跟踪到 36.152.44.93 的路由
1 10 ms 1 ms 1 ms 192.168.0.1
2 5 ms 2 ms 1 ms SMBSHARE [192.168.1.1]
3 5 ms 5 ms 4 ms 100.92.128.1
4 800 ms 900 ms 1200 ms 218.207.122.57 -- 可以发现这一条的延时很高
5 29 ms 26 ms 27 ms 36.152.44.93
通过Tracert可以发现,重点排查该地址段。
从接入交换机到BRAS的时延很高

节点验证测试
针对 218.207.122.57 执行专项 PING 测试,确认时延异常:
JianKong>ping 218.207.122.57
正在 Ping 218.207.122.57 具有 32 字节的数据:
来自 218.207.122.57 的回复: 字节=32 时间=500ms TTL=51
来自 218.207.122.57 的回复: 字节=32 时间=1200ms TTL=51
来自 218.207.122.57 的回复: 字节=32 时间=800ms TTL=51
来自 218.207.122.57 的回复: 字节=32 时间=900ms TTL=51
218.207.122.57 的 Ping 统计信息:
数据包: 已发送 = 4,已接收 = 4,丢失 = 0 (0% 丢失),
往返行程的估计时间(以毫秒为单位):
最短 = 500ms,最长 = 1200ms,平均 = 850ms
三、高时延根源排查
遵循 “先设备后链路、先核心后边缘” 的排查原则,逐步定位故障点。
1. BRAS 设备核查
运行状态:下挂多机房数据均无异常上报,设备负载正常
告警信息:无端口错误、链路闪断等异常告警
结论:BRAS 设备运行正常,排除设备本身故障
2. 传输链路核查
重点排查传输设备收发光衰耗(链路故障常见诱因):
操作:协调传输专业人员检测链路节点光功率
结果:各节点收发光强度均在正常阈值范围内(-8dBm 至 – 20dBm)
结论:传输链路质量合格
3. 接入交换机深度排查
交换机为新建设备,优先通过替代测试与配置核查定位问题:
步骤 1:替代测试验证
用 PC 直接连接链路测试至 BRAS 时延,结果显示时延 < 10ms,无异常。故障点锁定至交换机设备。
步骤 2:配置初始化测试
操作:将交换机恢复出厂设置,仅配置 BRAS 互联接口 IP
结果:PING 测试时延正常,排除硬件本身故障
分析:故障与交换机下挂配置相关,疑似存在环路或配置冲突
步骤 3:下挂配置核查
接入视频监控二层配置后,执行告警与日志核查:
命令:、
display alarm all、
display alarm history
display logbuff
结果:无环路告警、端口错误等异常信息,但视频卡顿故障复现,交换机至 BRAS 时延回升至 800ms+
步骤 4:端口状态深度核查
执行端口详情查询命令,定位关键异常:
<SW>display interface GigabitEthernet0/0/1
GigabitEthernet2/1/0/0 current state : UP
Line protocol current state : UP
Description:TO-[BRAS]
Switch Port, TPID : 8100(Hex), The Maximum Frame Length is 9216
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is c8c4-655c-e400
Last physical up time : 2022-07-15 01:37:33 UTC+08:00
Last physical down time : 2022-07-15 01:37:22 UTC+08:00
Current system time: 2023-06-05 09:41:34+08:00
Port Mode: COMMON FIBER, Transceiver: 10GBASE_LR_SFP
Speed : 10, Loopback: NONE -- 问题点在这里,端口仅仅有10MB的带宽
Duplex: FULL, Negotiation: DISABLE
Mdi : -, Flow-control: DISABLE
Last 300 seconds input rate 27216 bits/sec, 33 packets/sec
Last 300 seconds output rate 29008 bits/sec, 34 packets/sec
Input peak rate 54504 bits/sec, Record time: 2022-11-22 20:48:04
Output peak rate 563765664 bits/sec, Record time: 2022-07-15 01:46:01
关键发现:交换机与 BRAS 互联端口带宽默认配置为 10MB,远低于视频传输需求。
四、故障解决与验证
解决方案:协调 BRAS 侧调整端口配置,将带宽由 10MB 升级至 1000MB
效果验证:
PING 测试:往返时延降至 20-30ms,恢复正常
业务验证:视频监控实时点播流畅,无卡顿现象
故障原因说明
交换机与 BRAS 互联端口因需求申报遗漏带宽参数,默认配置为 10MB 窄带宽。当视频监控数据(码流通常为 2-8Mbps / 路)集中上传时,端口带宽饱和导致网络拥堵,引发传输时延剧增,最终表现为视频卡顿。带宽调整后,传输瓶颈消除,故障现象彻底解决。
预防措施
配置规范:设备互联端口需明确标注带宽需求,纳入配置审核清单
验收流程:新建网络部署后,增加端口速率、链路质量专项测试环节
监控机制:对关键业务端口配置带宽利用率阈值告警(建议阈值≥80% 触发告警)
总结
以上便是博主工作中的真实故障处理案例,您也可以关注微信公众号,后续我会更新更多的实操案例和讲解,希望对您有用,更多关于数通设备的资料,持续更新中,欢迎您的关注!
数通工程师
如果觉得这些经验对你有用,不妨动动手指,再顺手
点赞起来,方便后续回看或分享给有需要的朋友 —— 您的每一份支持,都是我继续分享的动力,感谢阅读!
收藏















暂无评论内容