取消
显示结果 
搜索替代 
您的意思是: 
cancel
5533
查看次数
20
有帮助
2
评论
yondong
Cisco Employee
Cisco Employee
本帖最后由 yondong 于 2018-2-27 14:46 编辑
简介
在处理客户Nexus 7000无法保存配置的故障中,绝大多数是由于客户设备中了bug CSCus22805所导致,以下内容为修复该bug的详细步骤。

1、确认设备故障是否属于软件BUG CSCus22805的方法是通过命令show system internal raid检查。
=========================================
n7k1-a9(standby)# show system internal raid
Current RAID status info:
RAID data from CMOS =0xa5
0xf0
ß----- 此位置最后数值应为0xf0
RAID data from driver disks 0bad 0 name
Bootflash: /dev/sde
Mirrorflash: /dev/sdd
Current RAID status:
Personalities : [raid1]
md6 :active raid1 sde6[0] sdd6[1]
77888 blocks[2/2]
[UU]
< --------- 此处应为UU
md5 : active raid1sde5[0] sdd5[1]
78400 blocks[2/2]
[UU]
< --------- 此处应为UU
md4 : active raid1sde4[0] sdd4[1]
39424 blocks[2/2]
[UU]
< --------- 此处应为UU
md3 : active raid1sde3[0] sdd3[1]
1802240 blocks[2/2]
[UU]
< --------- 此处应为UU
……
RAID data from CMOS = 0xa5 0xf0
……
---------------------------------------------------
在命令输出中,如果不满足上述状态,即表明故障由于软件bug CSCus22805 所致。


2. 故障根据输出结果分为以下几类:
0xf0 ==>> No failures reported
0xe1 ==>> Primary flash failed
0xd2 ==>> Alternate (or mirror) flash failed
0xc3 ==>> Both primary and alternate failed


3. 故障恢复步骤:
1) 0xe1和0xd2故障可以通过直接在对应板卡上load recovery tool来进行修复

相关细节:
**Flash Recovery Tool:**

n7000-s2-flash-recovery-tool.10.0.2.tar.gzis available to be downloaded from Cisco support site. This works as a customplug-in that can be run using the 'load' CLI.

- To run the tool, downloadand copy it to bootflash/volatile/slot0.

extract it
#tar extractbootflash:n7000-s2-flash-recovery-tool.10.0.2.tar.gz

run with the load command
#loadbootflash:n7000-s2-flash-recovery-tool.10.0.2.gbin

- Tool automatically fixesany single flash errors when present.
- If a standby available, itwill copy itself to standby and run there.
- No side effects if thereare no errors reported at the time.
- Tool will not attempt dualflash recovery either on active or standby.
工具下载地址:

2) 0xc3故障需要通过重启引擎来恢复,可分为以下几种情况:
A . 主引擎0xc3故障:
切换主备引擎,待故障槽位板卡重启恢复后通过show system internal raid命令检查确认。必要时可执行recovery tool修复。
B. 备引擎0xc3故障:
可通过重启备引擎来恢复,待板卡重启完毕后通过show system internalraid命令检查确认。必要时可执行recovery tool修复。
C. 主备引擎同时存在0xc3故障:
该情况下无恢复方法,需要通过整机重启进行恢复。同时需要注意备份配置与license。
若重启无法恢复,需要通过
手工初始化raid
并复制加载image方式进行恢复。

:手工初始化raid步骤
(需要准备笔记本/软件版本镜像/网线/tftp ,注意是TFTP,不是FTP也不是USB)
Step 1. 进行reload 操作。
Prevent thestandby from autobooting itself during the recovery procedures.
该命令作用,在操作过程中阻止备引擎自动重启。
switch#system standby manual-boot
systemstandby manual-boot option enabled
Step 2. 在引擎重启过程中,通过Control-C 中断重启过程,使该引擎进入loader模式。
Autobootingbootflash:/n7000-s2-kickstart.6.1.2.bin bootflash:/n7000-s2-dk9.6.1.2.bin...
Filesystem type is ext2fs, partition type 0x83
Bootingkickstart image: bootflash:/n7000-s2-kickstart.6.1.2.bin....
.................AbortingImage Boot
Error 2: Badfile or directory type

GNU GRUB version 0.97
Loader Version 4.1.9
loader>
Step 3. 手动启动kickstart,使引擎进入boot模式。如果bootflash不可用,可以通过引擎mgmt口连接PC使用TFTP手动启动kickstart。
loader>dir

bootflash:
lost+found
vdc_2
vdc_3
vdc_4
vdc_5
vdc_6
vdc_7
vdc_8
vdc_9
n7000-s2-kickstart.6.1.2.bin
n7000-s2-dk9.6.1.2.bin

loader>boot n7000-s2-kickstart.6.1.2.bin
Filesystem type is ext2fs, partition type 0x83
Bootingkickstart image: n7000-s2-kickstart.6.1.2.bin....
.........................................................


switch(boot)#
Step 4. 重新初始化flash系统。
switch(boot)#init system
This commandis going to erase your startup-config, licenses as well as the contents of yourbootflash:.
Do you wantto continue? (y/n) y
Initializingthe system...
Unmountingfile systems...
StoppingRAID services...
Makingpartitions on physical devices...
InitializingRAID services...
Initializingstartup-config and licenses...
mke2fs 1.35(28-Feb-2004)
Checking forbad blocks (read-only test): done
mke2fs 1.35(28-Feb-2004)
Checking forbad blocks (read-only test): done
FormattingPSS:
mke2fs 1.35(28-Feb-2004)
Checking forbad blocks (read-only test): done
Formattingbootflash...
mke2fs 1.35(28-Feb-2004)
Checking forbad blocks (read-only test): done
Mon Jan 1211:29:17 2015: RAIDMON: Data(0x0) provided saved successfully to CMOS
mount: can'tfind /mnt/bootloader in /etc/fstab or /etc/mtab
ERROR:cannot mount filesystem
ResettingCMOS to default configuration...
ReinitializingNVRAM contents...
Initializationcompleted.
switch(boot)#

执行完操作之后,bootflash里什么文件都没了, 只能拿出准备好的版本从自己的笔记本里传过去了.方法在这个链接里


Step 5. 重启该引擎。
switch(boot)#reload
This commandwill reboot this supervisor module. (y/n) ? y
[ 484.294418] Restarting system.

>>>
Loader Version 4.1.9

loader>
Step 6. 通过主引擎操作重启故障引擎。
switch#system no standby manual-boot
systemstandby manual-boot option disabled
switch#reload module 6 force-dnld
switch#
Step 7.通过命令检查raid状态, 并确认bootflash中文件内容与主引擎同步。
switch(standby)#show system internal raid
Current RAIDstatus info:
RAID datafrom CMOS = 0xa5 0xf0
RAID datafrom driver disks 0 bad 0 name
Bootflash:/dev/sdc
Mirrorflash:/dev/sdb

Current RAIDstatus:
Personalities: [raid1]
md6 : activeraid1 sdc6[0] sdb6[1]
77888 blocks [2/2] [UU]
md5 : activeraid1 sdc5[0] sdb5[1]
78400 blocks [2/2] [UU]
md4 : activeraid1 sdc4[0] sdb4[1]
39424 blocks [2/2] [UU]
md3 : activeraid1 sdc3[0] sdb3[1]
1802240 blocks [2/2] [UU]

评论
Yanli Sun
Community Manager
Community Manager
感谢专家分享
byl_qware_com
Level 8
Level 8
对我非常有帮助!谢谢!
入门指南

使用上面的搜索栏输入关键字、短语或问题,搜索问题的答案。

我们希望您在这里的旅程尽可能顺利,因此这里有一些链接可以帮助您快速熟悉思科社区:









快捷链接