一、基本信息
网络拓扑:
2、问题描述
故障现象是华为核心交换机学习对端H3c Rxxx交换机上的路由全部丢失。查看ospf peer与对端22.8.50.1状态处在exstart状态,ping22.8.50.1是正常的。
在本故障发生前时,裸光纤2发生物理故障,裸光纤2为备用链路,也就是说备用链路端的OSPF已经断开。根据对端网络管理员反馈当时在Rxxx-1上看到的ospf peer的ip地址为华为核心-2上的地址(22.9.50.2),这个是备用链路地址,我们这端看到的ospf对端地址是22.8.50.1.
重新修改裸光纤1这条两路两端设备的ospf认证密钥后,ospf正常建立起来。
3、问题分析
1)除了端口UP/DOWN的日志记录外,没有更多日志可分析,从现场工程师反馈的情况看这段时间“查看ospf peer与对端22.8.50.1状态处在exstart状态,ping22.8.50.1是正常的。根据对端网络管理员反馈当时在Rxxx-1上看到的ospf peer的ip地址为CE12804上10ge2/0/4/9的地址(22.9.50.2),这个是备用链路地址,我们这端看到的ospf对端地址是22.8.50.1.”
也就是说OSPF邻居中断后又自动进行了OSPF邻居建立的协商。并且协商进入了exstart状态。此时华为核心交换机学习到的邻居地址是正确的(22.8.50.1),所以在华为核心交换机上看不到OSPF报文错误计数,同时通过SHUTDOWN其端口也不能解决问题。
2)进一步分析h3c Rxxx-1为什么会收到华为核心的22.9.50.2的OSPF报文,通过组网和现场工程师确认出问题的时候两台二层接入交换机和管理交换机VLAN1是互通的。22.9.50.2的报文OSPF协议报文(组播报文)通过VLAN1广播到Rxxx-1设备上去了如红色箭头所示。也就是说出问题的时候,OSPF协议报文在二层交换机和管理交换机上vlan1内广播,22.8.50.1可以收到22.9.50.2接口发出的OSPF协议报文。
4、结论分析
由于网络组网存在问题,二层交换机之间的管理网络通过VLAN1连接,而没有按照规定的管理VLAN配置,造成网络连成环路。在OSPF连接状态正常的情况下不会爆发出问题,只有在这种两条裸光纤都发生故障时才会引发此故障。这里需要做自我检讨,当时把管理网络的配置工作交给同事来做,没有交待清楚要配置规划的VLAN,还好故障发生在业务上线前及时处理。