取消
显示结果 
搜索替代 
您的意思是: 
cancel
12186
查看次数
100
有帮助
15
评论
xupeng
Cisco Employee
Cisco Employee
虚拟交换系统四引擎状态化切换:提供最大正常运行时间与简化网络设计
Virtual Switching System Quad-Supervisor StatefulSwitchover - Delivering Maximum Uptime with Simplicity
(由于篇幅所限,只截取了部分章节发布到本贴)

VS4O是什么?

每个机箱配有一块引擎,把两个机箱配置成VSS可以提供1+1的机箱冗余。VS4O技术增强了VSS技术,它能够支持同一机箱内配有冗余引擎模块。VS4O中每个机箱内配备两块引擎模块, 第二块引擎模块被称为ICS(in-chassis standby supervisor,机箱内的备份引擎)。每个本地机箱的两个引擎模块使用SSO(Stateful Switchover)技术,在控制平面形成“SSO active”和“SSO standby hot”的关系。当active引擎故障时, standbyhot引擎将立即过渡到active的角色.在数据平面看来, 这种角色转变在一秒以内完成; 实际上,本地机箱维持正常的运行并保持所有链路active。在这种情况下,我们可以称这种冗余关系为: 1:1的VSS机箱内冗余, 伴随1+1的跨VSS机箱冗余(1:1 within the VSS chassis, followed by 1+1 across theVSS chassis.)

VS4O的主要好处

通过对机箱内冗余引擎的支持, 提升了VSS遇到机箱内个别引擎故障时的可恢复性和性能。
主要好处:
· 增加机箱的可恢复性
· 即便一个引擎发生故障,VSS保持100%带宽
· 引擎故障后的自动恢复
· 新的staggered模式(交错模式)软件升级过程, 减少了EFSU(enhanced fast software upgrade,增强快速软件升级)过程中个别线卡的链路停机时间

提高独立设备可恢复性的最直接的方法是添加冗余组件。添加冗余电源,风扇和冗余引擎,增加了机箱的整体预测可用性等级。

配置VS4O的第二个优点是VSS将保持100%的转发能力即便一块引擎发生故障。相比每个机箱只配置一块引擎,由于引擎发生故障导致所有线卡无法运作,这是一个显著的提升。

在VS4O配置中,引擎的恢复和更换过程更自动化。恢复过程是基于SSO技术可以在一秒内恢复。更换过程也被简化。从15.1(1)SY1软件版本开始, 完全支持VSS模式的机箱内配置冗余引擎,只需要将第二块引擎放入机箱。关于第二块引擎启动过程的详细信息将在本文的VS4O迁移章节进行叙述。

关于VS4O的软件升级, 新的交错模式(staggered mode)将会利用ICS引擎的优势并单独对ICS引擎进行软件升级。这种方式可以让线卡以最小的停机时间重新启动。关于这个过程的详细信息将在本文的软件升级章节进行叙述。

VS4O:如何工作?

VS4O采用多个redundancy domain(冗余域)来支持VSS模式下的机箱内冗余引擎。冗余域实际上是两个实体之间的active和standby SSO冗余模式的关系。图1显示了连同整个VSS机箱存在默认的冗余域(default redundancy domain)和新的机箱内冗余域(in-chassis redundancy domain)。

图1. VS4O冗余域

104255o9nzvkklpvv1lipo.jpg

默认的冗余域是整个VSS自身建立的域。默认的冗余域中的主备引擎模块分别分布在两个机箱中。 另外,新的机箱内冗余域仅存在于单个机箱内。每个VSS机箱自行设立机箱内的冗余域,它是独立于其它机箱的。

VS4O的初始化过程

当给配置了VSS的安装有两块引擎的机箱加电后, 每块引擎将开始各自的启动过程。在该初始化过程的早期时候,引擎将决定两个主要因素: 1. 它是一个VSS的配置 2.在同一个机箱内安装有冗余引擎. (如表1)

表1: 从系统控制台的摘要消息,说明检测到VSS模式,识别并解析到引擎的角色.




Supervisor Module Switch 1 Slot 1
Supervisor Module 1 Switch Slot 2
Cisco IOS Software, s2t54 Software (s2t54-ADVIPSERVICESK9-M), Version 15.1(1)SY1, RELEASE SOFTWARE (fc1)
Copyright (c) 1986-2013 by Cisco Systems, Inc.
Compiled Tue 26-Mar-13 19:08 by prod_rel_team
Image text-base: 0x04100144, data-base: 0x0C000000


System detected Virtual Switch configuration...
Interface TenGigabitEthernet 1/1/4 is member of PortChannel 1
Interface TenGigabitEthernet 1/1/5 is member of PortChannel 1
Interface TenGigabitEthernet 1/2/4 is member of PortChannel 1
Interface TenGigabitEthernet 1/2/5 is member of PortChannel 1

Initializing as Virtual Switch ACTIVE processor
Cisco IOS Software, s2t54 Software (s2t54-ADVIPSERVICESK9-M), Version 15.1(1)SY1, RELEASE SOFTWARE (fc1)
Copyright (c) 1986-2013 by Cisco Systems, Inc.
Compiled Tue 26-Mar-13 19:08 by prod_rel_team
Image text-base: 0x04100144, data-base: 0x0C000000


System detected Virtual Switch configuration...
Interface TenGigabitEthernet 1/1/4 is member of PortChannel 1
Interface TenGigabitEthernet 1/1/5 is member of PortChannel 1
Interface TenGigabitEthernet 1/2/4 is member of PortChannel 1
Interface TenGigabitEthernet 1/2/5 is member of PortChannel 1

*Jun 17 22:56:20.011: %SYS-3-LOGGER_FLUSHING: System pausing to ensure console debugging output.

Firmware compiled 06-Mar-13 08:26 by integ Build [25856]

*Jun 17 22:56:20.011: %PFREDUN-6-STANDBY: Initializing as STANDBY processor for this switch
*Jun 17 22:58:06.815: %SYS-3-LOGGER_FLUSHING: System pausing to ensure console debugging output.

这两块引擎将决定哪一块是ICA(in-chassis active, 机箱内主引擎), 哪一块是ICS(in-chassis standby,机箱内备引擎)。在一个正常的启动顺序,槽位号较小的引擎成为ICA。如果机箱内已经存在ICA,后插入的引擎将成为ICS。

下一步,在ICA将继续初始化过程, 尝试通过VSL建立通信,并协商默认冗余域中的冗余角色。在默认冗余域,只有每台机箱中的ICA引擎会参与通信如果由于某种原因,本端ICA引擎无法在指定的时间周期内与对端机箱的ICA引擎通信,它会成为默认冗余域和整体VSS中的主引擎角色。

在默认冗余域中的成为SSO Active的引擎, 将继续启动过程并开始初始化线卡和执行启动配置文件。

引擎切换事件

引擎模块发生故障是一种罕见的事件,但是仍然是有一定可能性的。在完整的VS4O配置中,
可能发生故障的四块引擎中最严重的是VSS主引擎故障, 即默认冗余域中的主引擎故障。下面会对VSS主引擎连续地故障进行详述。

图1显示了引擎模块与其冗余角色和它们各自的冗余域。如果VSS主引擎(switch1/slot1)故障,在检测到故障之后两个独立的恢复进程将会立即启动。整个VSS的控制平面在默认冗余域中被维持。默认冗余域始终是建立在VSS两个机箱上的; 在这种情况下, VSS备引擎 (switch2/slot1) 将从默认冗余域中的备引擎成为VSS主引擎。

在SW1中将启动另一个独立的恢复进程: switch1的ICS引擎(switch1/slot2)将检测到switch1/slot1槽的引擎故障, 并成为switch1的ICA。在默认冗余域中它将开始与对端机箱建立通信. 此时,默认冗余域的新VSS的主引擎是switch2/slot1。在默认冗余域中, 由于switch2/slot1已经参与并成为VSS主引擎的角色, 因此switch1/slot2将会成为VSS备引擎的角色。

重点:VSS控制层面是由默认冗余域中的主备引擎构成默认冗余域总是跨越VSS的两台机箱建立因此,当前的VSS主引擎故障或者被移除, 对端机箱将转变为新的VSS主引擎

为了进一步说明跨越机箱的恢复过程,图2显示了由于主引擎发生连续故障事件之后所得到的Z字形主引擎切换图。

图2. Z字形切换图

104333w303t4swvi7ts3mz.jpg

迁移到VS4O

迁移现有的VSS配置到VS4O是一个简单的过程。主要要求是VSS运行15.1(1)SY1或更高版本的Cisco IOS软件版本, 将新插入的冗余引擎模块设置为与ICA引擎使用相同的镜像启动。

冗余引擎可以直接插入到运行中的VSS机箱内;新插入的引擎将被自动配置为VSS(将设置为与ICA相同的VSS switchID)并协商成为ICS冗余模式。插入第二块引擎时对数据平面转发是没有影响的。

迁移到VS4O的主要步骤:
1.将现有的VSS升级到15.1(1)SY1或更高版本。
2.将第一块ICS引擎模块设置为使用与VSS相同的镜像启动。
3.将冗余引擎模块插入机箱(对先插入VSS active,还是先插入VSS standby机箱,并没有要求)
4.建立对VSS中每个引擎模块的console连接。
5.确认新插入的引擎被引导成为ICS.
6.配置并连接新ICS引擎的10Gb上联口成为VSL(可选步骤,但建议使用)。

在插入ICS引擎实现VS4O之前,需要升级现有的VSS15.11SY1或更高版本。之前版本的思科IOS软件不支持VSS模式的ICS。如果将运行在15.1(1)SY1之前的软件版的第二块引擎插入到正在运行的VSS中,第二块引擎要么在初始化阶段发生错误并进入rommon模式, 要么在初始化阶段发生错误并重启。然而,这对当前运行中的VSS是没有负面影响的。

表4. 插入与ICA运行不同软件版本的ICS引擎时的预期行为







ICS/ICA
VSS模式主引擎: 运行支持VS4O的软件版本(15.1(1)SY1 or 更高版本)
VSS模式主引擎: 运行不支持VS4O的软件版本 (15.1(1)SY 或更低版本)
VSS模式备引擎运行镜像兼容VS4O(15.1(1)SY1 or 更高版本)
ICS将启动成为VS4O机箱内SSO的热备
ICS将会启动成为RPR模式的冷备
独立模式备引擎运行镜像兼容VS4O(15.1(1)SY1 or 更高版本)
ICS检测到VSS模式的ICA, 自动设置switch号码,然后重启成为VS4O机箱内SSO的热备
ICS启动检测到VSS模式ICA, 设置switch号码,并重启进入rommon, ICS重启加载SY1, ICS成为RPR模式的冷备
备引擎使用独立模式默认配置加载15.1(1)SY或者之前版本
ICS将会加载IOS软件并识别它是不支持ICS,随后进入rommon
备引擎尝试加载成为独立模式的ICS, 由于等待主引擎通信超时, 再次重启
备引擎使用VSS配置加载15.1(1)SY或者之前版本

ICS将会加载IOS软件并识别它是不支持ICS,随后进入rommon

ICS将会加载IOS软件并识别它是不支持ICS,随后进入rommon
ICS的配置寄存器值为0x2102
ICS被引导进入rommon
ICS被引导进入rommon

可以使用空余机箱,为插入VSS的第二块引擎做准备。当使用空余机箱的方法,将引擎配置为使用15.1(1)SY1 镜像启动,或者任何能形成VSS的版本。如需支持VS4O,这个软件版本必须是15.1(1)SY1或者更高版本。无需将引擎配置成VSS模式,或者配置VSS switch号码。

如果没条件使用空余机箱去准备这块冗余引擎模块, 可以将冗余模块插入机箱后, 使用console连接去终端启动进程,并让引擎进入rommon,或者让引擎取消思科IOS软件初始化并进入rommon。这两种方法都不会导致VSS数据平面转发中断。

在冗余引擎进入rommon模式之后, 可以引导引擎加载外部文件系统中的正确软件版本。图5展示了使用CLI命令行从外部文件系统引导引擎加载软件镜像.

图5 CLI示例用于从在rommon引导第二块引擎

rommon 1 > dir bootdisk:

Digitally Signed Release Softwarewith key version A
Initializing ATA monitor library...
Directory of bootdisk:

3 33554432 -rw- sea_log.dat
2051 33554432 -rw- sea_console.dat
10053 0 drw- call-home
10054 9201 -rw- DTcfgvss02
10055 98141144 -rw- s2t54-advipservicesk9-mz.SPA.151-1.SY1

rommon 2 > bootbootdisk:s2t54-advipservicesk9-mz.SPA.151-1.SY1

Digitally Signed Release Softwarewith key version A
Initializing ATA monitor library...
bootdisk:s2t54-advipservicesk9-mz.SPA.151-1.SY1:Digitally Signed Release Software with key version A
Self extracting the image... [OK]

Self decompressing the image:#################################################################################
#################################################################################
#################################################################################
#################################################################################
#################################################################################
#################################################################################
###########

Cisco IOS Software, s2t54 Software(s2t54-ADVIPSERVICESK9-M), Version 15.1(1)SY1, RELEASE SOFTWARE (fc1)
Copyright (c) 1986-2013 by CiscoSystems, Inc.
Compiled Tue 26-Mar-13 19:08 byprod_rel_team
Image text-base: 0x04100144,data-base: 0x0C000000

System detected Virtual Switchconfiguration...
Interface TenGigabitEthernet2/1/4 is member of PortChannel 2
Interface TenGigabitEthernet2/1/5 is member of PortChannel 2

*Apr 17 20:56:30.911:%SYS-3-LOGGER_FLUSHING: System pausing to ensure console debugging output.

Firmware compiled 06-Mar-13 08:26 byinteg Build [25856]

*Apr 17 20:56:30.911:%PFREDUN-6-STANDBY: Initializing as STANDBY processor for this switch
*Apr 17 20:56:32.191:%SYS-SW2-2_STBY-3-LOGGER_FLUSHING: System pausing to ensure console debuggingoutput.

当ICS第一次插入到VSS机箱时, ICA将会检测到新插入的引擎没有配置VSS参数, ICA将会为ICS配置适当的参数, 包括VSS switchID, 并重启ICS。这是一次性的步骤,在随后的重启,引擎模块将有VSS的相关信息并直接引导成为ICA或ICS。在ICS完全启动后,可以使用CLI和SNMP方式去观察各个引擎模块的状态。

VS4O软件升级

VS4O的IOS软件版本升级主要有两种方式: 通过手动配置更改引导变量后重启设备或使用EFSU的方式升级。使用EFSU的方式升级,将使用思科IOS的ISSU基础设施分别对VS4O的机箱进行升级。VSS的EFSU过程对网络设计中设备双上联连到VSS最有利, 换句话说,网络设备通过MEC或者3层冗余路径连接到VSS。这种方式, 无论哪一台机箱升级(包括机箱重启), 用户数据流量会使用冗余的以太信道或者3层冗余路径的SSO/NSF技术在另一台机箱中转发。

VS4O Staggered模式升级

EFSU过程中新的staggered模式是VS4O独有的。staggered模式在EFSU升级过程中, 先升级ICS,这样当线卡升级时, 重启时间将显著减少。取决于配置不同,使用staggered模式可以减少线卡链路停机时间到平均3-5分钟。

VS4O Staggered模式升级过程

VS4O staggered模式升级过程与以往的EFSU升级使用相同的CLI命令行。基于思科IOS软件ISSU基础设施的CLI命令行并使用相同步骤,从loadversion到commitversion,如图8所示。

图8. ISSU升级过程

104353pu23b3rwz1jeus5j.jpg

EFSUstaggered模式在ISSU升级过程中增加了两个额外的自动程序:在loadversion阶段升级ICS和在commitversion阶段升级ICS。这些自动化的过程是无需额外输入CLI命令。

Staggered模式Loadversion阶段

ISSU升级从loadversion阶段开始。我们使用图9来描述整个VS4O的升级过程。

图9. EFSU升级过程前的VS4O冗余引擎模块状态

104548gzlbk3koqc0s444q.jpg
当用户输入loadversion命令, ISSU进程将开始升级VSS standby机箱内的ICS引擎(switch2slot2)。当ICS完全加载新的软件版本后, 进程将继续自动重启VSS standby机箱内的ICA引擎(switch2slot1), ICA引擎是VSS默认冗余域的standby引擎。

注意,此时switch2slot1引擎并没有升级到新的软件版本; 只是单纯的重启。
因为它是switch2的ICA, 重启将强制使switch2中所有的线卡重启。然而, 当线卡开始重启, 他们将伴随新的ICA(switch2slot2)一同运行新的软件版本。因为新的ICA已经正常运行, 停机时间将减少为线卡重启时间,而不是线卡加上引擎重启时间。

当switch2 VSS standby机箱内所有线卡都完成升级后, console将显示loadversion阶段已经完成,并且提示用户运行issu runversion命令。(见图10和11)

图10. console消息提示输入Runversion

VSS01#
*Apr 18 17:33:44.366:%ISSU_PROCESS-SW1-6-LOADVERSION_INFO: Loadversion has completed. Please issuethe 'issu runversion' command after all modules come online.

图11. 完成Loadversion后的VS4O冗余引擎状态

104558zxc6g6vxzfbfmv2f.jpg

Staggered模式的runversion阶段

在runversion阶段,其目的是将VSS active角色移到运行新的软件版本的引擎上,在这个案例中VSS standby是(switch2slot2)。这是通过重启VSS active引擎(switch1slot1)实现的。当VSSactive(switch1slot1)重启, 两个不同的切换事件发生。VSS默认冗余域的active角色将从switch1slot1切换到switch2slot2。Switch1机箱内冗余域的ICA将切换到switch1slot2。随后,switch1slot2引擎将在默认冗余域中开始参与通信并成为VSS standby。 (如图12)

图12 .ISSURunversion阶段

104608zul2grc7g5xlddgg.jpg

在staggered模式的runversion阶段是在切换事件中比较重要的部分, 所有线卡无需重启, 对比tandem模式,VSS active机箱(包括线卡)将会在runversion阶段重启。

在Staggered模式, 因为switch1 ICA和ICS引擎都运行在相同的软件版本, 线卡无需重启。他们将经历SSO切换事件,但是这主要涉及线卡切换后模块之间通信的流量送到的新ICA交换矩阵上。switch1上线卡将经历数据平面收敛时间,通常在200ms内完成。

Staggered模式acceptversion阶段

与tandem模式一样,ISSU acceptversion阶段是可选步骤。acceptversion命令将停止runversion时自动启动的回退计时器。停止回退计时器后,用户可以无限期停留在runversion状态。

其目的是让用户来验证的新版本软件的功能。 因为runversion阶段保持standby机箱(这个例子中是switch1)运行在原始软件版本。在升级过程中可以很容易地被中止,并让系统恢复到原始的软件版本。

ISSUabortversion命令

单条issu abortversion命令用来恢复系统到原来的软件版本,并结束ISSU升级过程。issu abortversion命令将会强制让switch2引擎模块重启并且加载原始软件版本。

Staggered模式的commitversion阶段

升级过程的最后阶段是ISSUcommitversion阶段。在此阶段开始时,VSS active已运行新的软件版本。
它的目的是完成最终的升级过程和升级的其余组件。使用issucommitversion命令进入commitversion阶段,两个自动化步骤的第一步开始设置引导变量和重启VSS standby的ICS,在这个例子中, 是switch1slot1的引擎模块。(如图13)

图13. Commitversion阶段 第一步

104617zp5j5rarjwpjwvpr.jpg

将VSS standby机箱的ICS完成重启到新的软件版本之后,commitversion阶段第二步自动开始,无需用户干预。现在VSS standby的ICA是switch1slot2配置了新的启动变量并重启。这也将强制让switch1中的线卡重启。由于switch1ICS(switch1slot1)已经运行这个版本,使得最小化线卡重启时间, 线卡将初始化并由新的ICA(switch1slot1)控制。

在同一时间,switch2 ICS的升级也会发生。因为引擎模块在ICS状态, 它不会对switch2的线卡产生任何影响。(如图14).
图14. Commitversion阶段第二步
104623fgzy3csc3comfghp.jpg

总结
思科Catalyst虚拟交换系统不断发展新的创新能力, 包括支持VS4O 四引擎SSO. 配置VS4O提供更高的可用性和一致的带宽, 为网络实施提供了高可恢复性,例如:

●核心和分布网络设计
●服务模块部署
●单连接的设备的设计
●严格的带宽需求的设计

评论
Luke Huang
Cisco Employee
Cisco Employee
有图有真相,谢谢分享
congx
Cisco Employee
Cisco Employee
楼主好人 么么哒
chundli
Cisco Employee
Cisco Employee
好赞///
yinba
Cisco Employee
Cisco Employee
高大上 {:3_48:}
taosun2
Cisco Employee
Cisco Employee
Yanli Sun
Community Manager
Community Manager
感谢 Xu Peng 的分享~~~
blgao
Cisco Employee
Cisco Employee
好文章!
yanzha4
Spotlight
Spotlight
好!
lelwu
Cisco Employee
Cisco Employee
:D:D:D
shlei
Cisco Employee
Cisco Employee

有图有真相,谢谢分享
shlei
Cisco Employee
Cisco Employee
有图有真相,谢谢分享
pengxu
Community Member
谢谢分享!!!
cpmld-199
Community Member
谢谢分享,赞!
sxsure001
Spotlight
Spotlight
瞬间感觉高大上啊!
zzrboss
Spotlight
Spotlight
看这个时间比较节省,看英文版的需要花2倍时间。http://www.cisco.com/c/en/us/products/collateral/switches/mgx-8800-series-switches/white_paper_c11-729039.html
入门指南

使用上面的搜索栏输入关键字、短语或问题,搜索问题的答案。

我们希望您在这里的旅程尽可能顺利,因此这里有一些链接可以帮助您快速熟悉思科社区:









快捷链接