取消
显示结果 
搜索替代 
您的意思是: 
cancel
14045
查看次数
40
有帮助
4
评论
Luke Huang
Cisco Employee
Cisco Employee
##问题
n7k 连接第三方vendor 设备或者Cisco nexus 设备,LACP port-channel 会显示 down,物理接口 down/suspend/err-disable
##一般port-channel 故障诊断步骤
>从 show logging log 入手,查看物理接口和 port-channel down 的原因;
>show interface e2/30 观察是否存在 CRC 或者其他 input/output counter error,确认 link 可以正常传输数据;
>show interface e2/30 transceiver details 确认光模块收发光功率正常;
>一般物理问题比较容易判断,通过交叉测试就可以解决。
>
>如果接口是 suspend/error-disable,一般是 protocol down,需要根据 port-channel 和physical interface 的配置,逐步排查:
>通过show system internal event-history info ex/y 和 show system internal event-history interface ex/y,查看接口的底层 log,接口为什么 suspend;
>是否被 STP block;对端设备是否会run STP, 是否会发送 BPDU,本端interface 是否有配置 BPDU 高级 feature;检查 show spanning-tree interface ex/y;
>port-channel 使用 LACP active 与使用聚合 ON;如果使用 LACP active,需要确认两端 LACP 参数一致。如果使用 mode ON,建议两端都配置 mode ON 并且手动对比接口配置(有时候会看到 port-channel mode ON, port-channel up, 但是不能传输数据)。
>如果配置了 VPC,需要查看 VPC 是否正常,peer-link 是否 up,VPC 两端配置是否一致。show vpc, show vpc consistency-check
>
##举个栗子
n7k e1/30 & e2/30 在 port-channel 100, e1/30可以和对端正常协商为 port-channel,up;但是 e2/30 没有办法 up
N7710 %ETH_PORT_CHANNEL-5-PORT_SUSPENDED: Ethernet2/30: Ethernet2/30 is suspended by protocol, other reasons
1/ ethpm 信息发现接口被 protocol suspend,COMPAT_CHECK 一般是某些配置不兼容导致。_
151) FSM: Transition at 28040 usecs after Wed Mar 28 14:07:38 2018
Previous state: [ETH_PORT_FSM_ST_WAIT_BRINGUP]
Triggered event: [ETH_PORT_FSM_EV_BUNDLE_
COMPAT_CHECK
]
Next state: [No transition found]
152) Event:ESQ_RSP length:38, at 31972 usecs after Wed Mar 28 14:07:39 2018
Instance:436850688, Seq Id:0x1, Ret:port not compatible
[E_MTS_RX] Src:MTS_SAP_ETH_PORT_CHANNEL_MGR(378), Opc:MTS_OPC_ETHPM_PORT_BRINGUP(61442)
RRtoken:0x25E2FBF3
153) FSM: Transition at 32043 usecs after Wed Mar 28 14:07:39 2018
Previous state: [ETH_PORT_FSM_ST_WAIT_BRINGUP]
Triggered event: [ETH_PORT_FSM_EV_SUSPEND_PORT]
Next state: [ETH_PORT_FSM_ST_PORT_SUSPENDED]
154) FSM: Transition at 375211 usecs after Wed Mar 28 14:07:39 2018
Previous state: [ETH_PORT_FSM_ST_PORT_SUSPENDED]
Triggered event: [ETH_PORT_FSM_EV_EXTERNAL_REINIT_NO_FLAP_REQ] <<< no flap request, 可能是本端故障
Next state: [ETH_PORT_FSM_ST_WAIT_BRINGUP]

2/ physical interfaces 配置了 channel-group 100 mode active, 使用 LACP 协议,需要查看 LACP 的 PDU counter 是否收发正常
switch# show lacp counters
LACPDUs Marker Marker Response LACPDUs
Port Sent Recv Sent Recv Sent Recv Pkts Err
---------------------------------------------------------------------
port-channel100
Ethernet2/30 62003 2000 0 0 0 0 0
Ethernet1/30 2000 2001 0 0 0 0 0
可以看到 e2/30 发送的 LACP PDU,大概是接收 PDU 数量的30倍
而 e1/30 LACP 收发数量基本一致。
3/ LACP 有两种模式,normal 和 rate fast,猜测是两端模式配置不同。
n7k— n5k, 如果只是n5k 配置 lacp rate fast, 产生的效果,是 n7k 会每1s 发送一次 LACP PDU 给 n5k, n5k 超过3s 没收到 N7k LACP PDU,就会主动 tear down 这条 link —> lacp rate fast 是对 peer 的要求,并非本端
4/ 那么如何验证两端 LACP 参数是否一致? show lacp interface e2/30, 部分输出如下
switch# show lacp interface e1/48
Local Port: Eth1/48
LACP_Activity=active
LACP_Timeout=Long Timeout (30s)
Partner information refresh timeout=Short Timeout (3s) <<< n7k 对端配置了 lacp rate fast
Neighbor: 0x130
LACP_Activity=active
LACP_Timeout=short Timeout (1s)
5/ 目前为止,可以发现是 n7k 对端设备与 e2/30 互连接口,配置了 lacp rate fast; 与 e1/30 互连接口,是 lacp normal。
6/ 把 n7k 对端设备的 lacp rate fast 移除,问题解决。
##扩展
n7k e1/30 & e2/30 在 port-channel 100,分别与对端 n5k e1/1 & e1/2 互连;假设 n5k e1/1 & e1/2 都配置了 lacp rate fast。
>请问 n5k-n7k port-channel 是否能 up
>n5k 与 n7k show lacp counter interface port-channel 100, 接口 LACP PDU 收发比例(1:1, 1:30, 30:1)
>如果port-channel down, physical interfaces suspend/err-disable, 如何 debug
欢迎留言、讨论
评论
Yanli Sun
Community Manager
Community Manager
感谢楼主分享:handshake
byl_qware_com
Level 8
Level 8
分析的很详细,:)
jiabu@cisco.com
Cisco Employee
Cisco Employee
楼主真棒,学习了
lwyisccie_cisco
Community Member
楼主分析的很细
入门指南

使用上面的搜索栏输入关键字、短语或问题,搜索问题的答案。

我们希望您在这里的旅程尽可能顺利,因此这里有一些链接可以帮助您快速熟悉思科社区:









快捷链接