取消
显示结果 
搜索替代 
您的意思是: 
cancel
4463
查看次数
24
有帮助
6
回复

配置Portchannel后 CPU利用率下降

kpak00001
Spotlight
Spotlight
前天在3750和一台防火墙之间配了一个Portchannel,3层模式,负载均衡使用的源目的IP,配置的原因是之前37和防火墙之间的链路经常有带宽饱和,并且有出站队列丢弃的情况,配置好Portchannel后发现CPU利用率下降了不少,原先CPU利用率经常在40%左右,Portchannel后CPU利用率下降到了13%-20%左右,通过查看Cacti端口流量监控,可以很明显看到这个利用率下降就是在端口汇聚工作后发生的,但目前原因还不清楚,我觉得可能是因为出站接口带宽增加后,出站队列丢弃减少,从而导致处理器负载减低??哪位知道帮忙解答下,非常感谢!!
103923ujjx11195nmtpjaj.png
6 条回复6

one-time
Level 13
Level 13
静候小伙伴的回复哦!:)

kpak00001
Spotlight
Spotlight
本帖最后由 kpak00001 于 2016-4-15 18:00 编辑
哪位帮我看看呀,顶起来~
我换个问法,假如交换机上一个接口产生出站队列丢弃时会不会引起CPU负载升高??原因是什么?

Lei Zhang
Cisco Employee
Cisco Employee
您好!
首先,我不觉得配置port-channel与CPU利用率下降有直接关系。这个有可能只是一个现象,而不是根本原因。
其次,出队列尾丢弃与CPU无关。
要确定CPU为什么会比较高,首先,要恢复到CPU利用率较高水平,然后进行一些列troubleshooting。
1、判断high cpu时,那个进程利用率比较高;如果没有进程利用率较高,是不是“中断”(数据包进入CPU后,CPU处理数据包时所占用的CPU利用率)较高。
2、如果是进程利用率较高,需要判断该进程是做什么用的。进一步需要检查的话,可以联系Cisco TAC开case。
3、如果是中断比较高,需要判断,是什么类型的数据包(原目IP,原目mac,协议号等),这些数据包是否需要进入CPU?
请参考以下文档:
http://www.cisco.com/c/en/us/td/docs/switches/lan/catalyst3750/software/troubleshooting/cpu_util.html
http://www.cisco.com/c/en/us/support/docs/switches/catalyst-3750-series-switches/68461-high-cpu-utilization-cat3750.html
谢谢!
希望可以帮到你!

kpak00001
Spotlight
Spotlight
leiz2 发表于 2016-4-18 11:30 back.gif
您好!
首先,我不觉得配置port-channel与CPU利用率下降有直接关系。这个有可能只是一个现象,而不是根本原 ...

多谢,但是我这几天一直再观察CPU的利用率,确实在做完Port-channel之后,就一直在20%左右了,没有再像之前那么高过,这期间我们的业务流量没有发生什么变化。那我再问下关于CPU利用率的问题,
我的3750堆叠现在的CPU利用率截了个图如下,参考《Troubleshooting High CPU Utilization》,按文中描述的:堆叠的CPU利用率最小在7%-8%之间,对比我现在的这个利用率,我理解过去5分钟的所有活动系统进程占用率=总利用率24%减去最小利用率7%,再减去中断利用率5%=12%左右?这样理解对吗?然后这个12%就是5秒钟下面列出的所有进程利用率之和,其中主要是ADJ resolve proc 和 ARP Input 这两个进程导致的。
093223xhehdhaw8445461s.png

Lei Zhang
Cisco Employee
Cisco Employee
kpak00001 发表于 2016-4-19 09:55 back.gif
多谢,但是我这几天一直再观察CPU的利用率,确实在做完Port-channel之后,就一直在20%左右了,没有再像之 ...

您好!
首先第一个问题是CPU利用率是多少,才是high CPU事件产生?
这个并没有一个绝对值,需要在设备稳定转发业务流量的前提下,长期观察该设备CPU利用率,得出一个平均值,然后以该平均值为基数,当CPU利用率高于该基数很多时,high CPU故障发生。
举个简单的例子:
4台3750堆叠,然后创建70个interface vlan,然后用70个interface vlan接口创建ospf邻居。在这种场景下,即便没有任何业务,没有其他任何feature的情况下,可以预见的是,CPU利用率一定很高。因为,ospf包(包括hello,dbd,lsa)都需要CPU处理,3750的CPU能力有限,同时处理这么多数据包,一定会high CPU。
同样的,70个interface vlan建70个ospf邻居,如果换成65或者76,也许CPU利用率也就是20%左右。
所以,是不是high CPU故障,需要判断:
1、 是不是CPU利用率高于基准值。没有基准值,也就无从谈起是不是high CPU故障。因为,有可能就是设计不合理,或者选型不合理造成的high CPU,但这种high CPU本质上不是故障
2、 high CPU产生时,是哪个进程引起或者中断。
回到你这个问题上,仅从你这个输出来看,20%多的利用率,我觉得不算高。
ADJ resolve proc和ARP Input两个进程,处理arp数据包(arp request,reply)。2.07%,1.91% 很正常。
另外,show process cpu输出,该怎样理解:
注意到,输出中“22%/5%”,5秒的CPU总利用率为22%,其中“中断(CPU处理数据包所消耗的CPU资源)”占5%。
总的CPU利用率22%=所有进程占用CPU利用率17%+中断占用CPU利用率5%
谢谢!

kpak00001
Spotlight
Spotlight
本帖最后由 kpak00001 于 2016-4-19 14:01 编辑
leiz2 发表于 2016-4-19 13:27 back.gif
您好!
首先第一个问题是CPU利用率是多少,才是high CPU事件产生?
这个并没有一个绝对值,需要在设备稳 ...

多谢:handshake,但我还有一个地方不太明白,就是那个总利用率22%=所有进程利用率17% + 终端占用CPU利用率的5%,进程利用率是17%,那为什么那些进程的利用率加起来才12.14%?剩下的4%是什么占用了?:lol
快捷链接