请选择 进入手机版 | 继续访问电脑版

设为首页 收藏本站
思科服务支持社区 点击关注
思科服务支持社区

  
 找回密码
 立即注册

扫一扫,访问微社区

搜索
热搜: 邮件服务器
查看: 1519|回复: 2

【原创】故障诊断步骤 - n7k port-channel 问题排查

[复制链接]
发表于 2018-4-2 20:40:33 | 显示全部楼层 |阅读模式
##问题
n7k 连接第三方vendor 设备或者Cisco nexus 设备,LACP port-channel 会显示 down,物理接口 down/suspend/err-disable

##一般port-channel 故障诊断步骤
>从 show logging log 入手,查看物理接口和 port-channel down 的原因;
>show interface e2/30 观察是否存在 CRC 或者其他 input/output counter error,确认 link 可以正常传输数据;
>show interface e2/30 transceiver details 确认光模块收发光功率正常;
>一般物理问题比较容易判断,通过交叉测试就可以解决。
>
>如果接口是 suspend/error-disable,一般是 protocol down,需要根据 port-channel 和physical interface 的配置,逐步排查:
>通过show system internal event-history info ex/y 和 show system internal event-history interface ex/y,查看接口的底层 log,接口为什么 suspend;
>是否被 STP block;对端设备是否会run STP, 是否会发送 BPDU,本端interface 是否有配置 BPDU 高级 feature;检查 show spanning-tree interface ex/y;
>port-channel 使用 LACP active 与使用聚合 ON;如果使用 LACP active,需要确认两端 LACP 参数一致。如果使用 mode ON,建议两端都配置 mode ON 并且手动对比接口配置(有时候会看到 port-channel mode ON, port-channel up, 但是不能传输数据)。
>如果配置了 VPC,需要查看 VPC 是否正常,peer-link 是否 up,VPC 两端配置是否一致。show vpc, show vpc consistency-check
>

##举个栗子

n7k e1/30 & e2/30 在 port-channel 100, e1/30可以和对端正常协商为 port-channel,up;但是 e2/30 没有办法 up

N7710 %ETH_PORT_CHANNEL-5-PORT_SUSPENDED: Ethernet2/30: Ethernet2/30 is suspended by protocol, other reasons

1/ ethpm 信息发现接口被 protocol suspend,COMPAT_CHECK 一般是某些配置不兼容导致。_
151) FSM:<Ethernet2/30> Transition at 28040 usecs after Wed Mar 28 14:07:38 2018
        Previous state: [ETH_PORT_FSM_ST_WAIT_BRINGUP]
        Triggered event: [ETH_PORT_FSM_EV_BUNDLE_COMPAT_CHECK]
        Next state: [No transition found]

152) Event:ESQ_RSP length:38, at 31972 usecs after Wed Mar 28 14:07:39 2018
        Instance:436850688, Seq Id:0x1, Ret:port not compatible
        [E_MTS_RX] Src:MTS_SAP_ETH_PORT_CHANNEL_MGR(378), Opc:MTS_OPC_ETHPM_PORT_BRINGUP(61442)
        RRtoken:0x25E2FBF3

153) FSM:<Ethernet2/30> Transition at 32043 usecs after Wed Mar 28 14:07:39 2018
        Previous state: [ETH_PORT_FSM_ST_WAIT_BRINGUP]
        Triggered event: [ETH_PORT_FSM_EV_SUSPEND_PORT]
        Next state: [ETH_PORT_FSM_ST_PORT_SUSPENDED]

154) FSM:<Ethernet2/30> Transition at 375211 usecs after Wed Mar 28 14:07:39 2018
        Previous state: [ETH_PORT_FSM_ST_PORT_SUSPENDED]
        Triggered event: [ETH_PORT_FSM_EV_EXTERNAL_REINIT_NO_FLAP_REQ] <<< no flap request, 可能是本端故障
        Next state: [ETH_PORT_FSM_ST_WAIT_BRINGUP]
        
2/ physical interfaces 配置了 channel-group 100 mode active, 使用 LACP 协议,需要查看 LACP 的 PDU counter 是否收发正常
switch# show lacp counters
                                        LACPDUs         Marker      Marker Response    LACPDUs
Port              Sent   Recv     Sent   Recv     Sent   Recv      Pkts Err
---------------------------------------------------------------------
port-channel100
Ethernet2/30      62003  2000    0      0        0      0        0      
Ethernet1/30       2000  2001    0      0        0      0        0      
可以看到 e2/30 发送的 LACP PDU,大概是接收 PDU 数量的30倍
而 e1/30 LACP 收发数量基本一致。

3/ LACP 有两种模式,normal 和 rate fast,猜测是两端模式配置不同。
n7k— n5k, 如果只是n5k 配置 lacp rate fast, 产生的效果,是 n7k 会每1s 发送一次 LACP PDU 给 n5k, n5k 超过3s 没收到 N7k LACP PDU,就会主动 tear down 这条 link —> lacp rate fast 是对 peer 的要求,并非本端
4/  那么如何验证两端 LACP 参数是否一致? show lacp interface e2/30, 部分输出如下
switch# show lacp interface e1/48
Local Port: Eth1/48   
  LACP_Activity=active
  LACP_Timeout=Long Timeout (30s)
Partner information refresh timeout=Short Timeout (3s) <<< n7k 对端配置了 lacp rate fast

Neighbor: 0x130
  LACP_Activity=active
   LACP_Timeout=short Timeout (1s)

5/ 目前为止,可以发现是 n7k 对端设备与 e2/30 互连接口,配置了 lacp rate fast; 与 e1/30 互连接口,是 lacp normal。
6/ 把 n7k 对端设备的 lacp rate fast 移除,问题解决。

##扩展
n7k e1/30 & e2/30 在 port-channel 100,分别与对端 n5k e1/1 & e1/2 互连;假设 n5k e1/1 & e1/2 都配置了 lacp rate fast。
>请问 n5k-n7k port-channel 是否能 up
>n5k 与 n7k show lacp counter interface port-channel 100, 接口 LACP PDU 收发比例(1:1, 1:30, 30:1)
>如果port-channel down, physical interfaces suspend/err-disable, 如何 debug

欢迎留言、讨论

  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5
平均得分5 (4 评价)
发表于 2018-4-3 10:05:47 | 显示全部楼层
感谢楼主分享
  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5
平均得分2 (1 评价)
发表于 2018-4-3 10:09:44 | 显示全部楼层
分析的很详细,
  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5
平均得分0 (0 评价)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver | 思科服务支持社区  

GMT+8, 2018-9-21 05:11 , Processed in 0.084765 second(s), 33 queries .

京ICP备09041801号-187

版权所有 :copyright:1992-2019 思科系统  重要声明 | 保密声明 | 隐私权政策 | 商标 |

快速回复 返回顶部 返回列表