发布时间:2009-09-25
1、前言
随着网络的发展,用户对于网络的可靠性提出了越来越高的要求。不间断转发NSF (None Stop Forwarding)就是一项重要的高可靠性技术(HA,High Availability),它可以保证核心路由器/交换机控制层面出现故障时,数据转发仍然正常执行,从而保护网络上关键业务不受影响。目前,不间断转发技术NSF正在得到越来越广泛的应用。
2、不间断转发的弊端
不间断转发是指在路由器控制层面故障的过程中,数据转发不间断地正常执行。路由器/交换机控制层面故障的原因可能有多种,如由于软件或者硬件故障导致的路由器/交换机故障或者重启,或者软件升级时通过配置命令导致的的主备切换等等。
通常情况下,路由器/交换机故障后,其路由协议层面的邻居会检测到它们之间的邻居关系Down掉,然后过段时间再次Up,这个过程被称之为邻居关系震荡。这种邻居关系的震荡将最终导致路由震荡的出现,使得重启路由器/交换机在一段时间内出现路由黑洞或者导致邻居将数据业务从重启路由器/交换机处旁路,从而导致网络的可靠性大大降低。
3、快速平滑重启简介
基于智能高可用IP设计理念,锐捷高端交换产品通过GR快速平滑重启技术,可实现核心产品在进行引擎切换数据不间断转发的时候,路由邻居关系不会产生震荡,提升网络的可靠性。
GR机制的核心在于:当某设备的路由协议重启时,能够通知周边设备在一定时间内将到该设备的邻居关系和路由保持稳定。在路由协议重启完毕后,周边设备协助其进行路由信息同步,在尽量短的时间内使该设备的各种路由信息恢复到重启前的状态。在整个协议重启过程中,网络路由和转发保持高度稳定,报文转发路径也没有任何改变,整个系统可以不间断地转发IP报文。这个过程即称为快速平滑重启。
锐捷RG-S8600系列万兆核心交换机支持GR for OSFP/BGP等路由协议,当主引擎发生主备倒换时,对端设备的继续保持与本设备的协议邻居关系,避免网络收敛和振荡,保证网络的稳定性。
4、快速平滑重启技术原理
配置了GR功能的设备称为“具备GR能力”的设备。具备GR能力的设备在协议重启时,能实现平滑重启,保证转发业务不中断;而不具备GR能力的设备在协议重启时,则只能遵循普通的重启过程。GR中涉及到的基本概念如下:
GR Restarter:GR重启路由器,指由管理员或故障触发而协议重启的设备,它必须具备GR能力。
GR Helper:即GR Restarter的邻居,能协助重启的GR Restarter保持路由关系的稳定,它也必须具备GR能力。
GR Session:GR会话,是GR Restarter和GR Helper之间的协商过程。包括协议重启通告,协议重启过程中的信息交互等。通过该会话,GR Restarter和GR Helper可以掌握彼此的GR能力。
GR Time:GR时间,是GR Restarter和GR Helper协商建立一个会话所用的时间。当某GR路由器发现邻居路由器处于down状态时,将在该时间内仍保留其发出的拓扑或路由信息。
GR通讯过程(见上图):
1. GR Restarter和GR Helper之间建立GR Session。
2. GR Restarter重新启动,当各GR Helper发现其对端GR Restarter处于协议重启状态时,不仅继续保持GR Session,而且在GR Time内仍保留来自GR Restarter的拓扑或路由信息。
3. GR Restarter向GR Helper发送信号,GR Restarter的重新启动完成后,会向其每个GR Helper发送信号,从而重新建立GR Session。
4. GR Restarter从GR Helper获取拓扑或路由信息,GR Restarter通过与所有GR Helper建立GR Session,可获得拓扑或路由信息,并以此重新计算自己的路由表。
5、GR技术应用
在上述大型网络中,采用双核心(每台核心双引擎)部署,每台汇聚设备上连到核心。汇聚与核心设备均支持GR功能。整网部署OSPF路由协议。
当其中一台核心(支持GR)引擎切换,能够通知周边设备在一定时间内将到该设备的邻居关系和路由保持稳定,与这台核心相连接的邻居设备(支持GR)收到信息后立即隐藏出问题核心设备的重启事件。
此时其他设备并没有感到网络产生重启,于是路由没有产生任何的震荡。当故障设备重启后,再重新与各个邻居设备建立邻居关系,并将最新的路由表倒入到切换后的设备,并以此重新计算自己的路由表,正常转发数据。
锐捷高端交换智能高可用IP设计理念
