交换机
园区网交换机
数据中心与云计算交换机
行业精选交换系列
意图网络指挥官
无线
放装型无线接入点
墙面型无线接入点
智分无线接入点
室外无线接入点
场景化无线
行业精选无线系列
无线管理与应用
1)故障现象
组播网络部署完毕后,PC无法点播成功网络中心提供的组播视频
2)故障处理流程
3)故障处理步骤
a.步骤1 配置检查
查看从组播源到接收者传输路径上的所有设备组播基本配置是否正确,目前常用的域内组播技术为PIM—DM和PIM-SM。
--》组播配置之前要求整个PIM域内单播路由已经部署完毕,各节点都路由可达。
PIM-DM基本配置检查:
是否全局开启组播路由协议(ip multicast-routing);
是否在需要接受或转发组播的接口上都开启了PIM-DM和IGMP(默认开启组播路由的同时开启IGMP),特别是组播源以及用户端的SVI接口;
ruijie(config)#int vlan 10
ruijie(config-if-VLAN 10)#ip pim dense-mode
PIM-DM高级配置检查:
检查是否错误的配置了邻居过滤;
ruijie(config-if-VLAN 10)#ip pim neighbor-filter DM-filter-ACL
优化过滤配置ACL是否配置错误导致合法组播/IGMP报文被丢弃
PIM-SM基本配置检查:
是否全局开启组播路由协议;
是否在需要接受或转发组播的接口上都开启了PIM-SM和IGMP(默认开启组播路由的同时开启IGMP);
配置静态RP或动态RP(C-RP与C-BSR);
ruijie(config)#ip pim rp-address 1.1.1.1
PIM-SM高级配置检查:
检查是否配置了错误的邻居过滤;
配置的RP注册报文过滤是否正确;
ruijie(config)#ip pim accept-register list 100
配置的BSR合法范围限制是否正确;
ruijie(config)#ip pim accept-bsr list 200
配置的C-RP合法范围及组播组是否正确;
ruijie(config)#ip pim accept-crp list 300
优化过滤配置ACL是否配置错误导致合法组播/IGMP报文被丢弃。
IGMP高级配置检查:
查看是否配置了IGMP Access-Group 组播控制,是否添加ACL正确;
ruijie(config-if-VLAN 10)#ip igmp access-group 400
查看是否在一个有多用户的端口上错误的配置了fast-leave特性;
查看接口下配置的ip igmp limit是否太小,缺省为1024.
接入交换机IGMP-Snooping配置检查:
Ruijie(config)# show ip igmp snooping
IGMP Snooping running mode: SVGL
SVGL vlan: 1
SVGL profile number: 11
Source port check: Disable
Source ip check: Disable
IGMP Fast-Leave: Disable
IGMP Report suppress: Disable
检查配置是IVGL模式或SVGL模式(SVGL必须配合IGMP Profile使用)
IGMP Profile中只有在这批组播地址范围内的数据流,才可以是跨VLAN 转发,对于不在此范围内的组播流,将不能被转发;默认情况下所有的组范围都不在SVGL 的应用范围,所有的组播流将被丢弃
ip igmp profile 11
permit
range 239.1.1.0 239.1.1.255
检查路由口是否静态配置或自动学习并开启了源端口/源IP检查(故障排查时可将源端口检查高级功能取消,防止相关高级安全功能干扰故障排查)
Ruijie(config)#ip igmp snooping source-check port
检查用户端口是否开启IGMP Snooping Fliter功能,可在故障排查时先取消。
b.步骤2 查看组播源是否有发出组播报文,组播接收端是否有接受到组播报文
在应用的层面查看组播源、组播接收端是否工作正常,可以考虑采用捉包的方式进行确认。在某些情况下可能存在组播源服务器部署错误、组播客户端参数设置错误等问题,可以在此步骤中进行排除或使用替换法解决;
同时对组播源的捉包有助于了解组播报文的特性,例如是否存在分片、组播报文大小、源目标IP,端口等、TTL等,通常了解这些参数对于后续的故障排查也是非常有用的。
c.步骤3 查看源途(从组播源到组播目标)设备是否有建立正确的组播路由表项
--》组播建立的前提:单播路由正常
PIM-DM的查看方法:
ruijie#show ip mroute (转发表)
IP Multicast Routing Table
Flags: I - Immediate Stat, T - Timed Stat, F - Forwarder installed
Timers: Uptime/Stat Expiry
Interface State: Interface (TTL)
组播源 组播目标
(210.34.130.27, 224.3.1.2), uptime 00:18:04 建立时间, stat expires 00:01:21 超时时间
Owner PIMDM, Flags: TF
Incoming interface: TenGigabitEthernet 3/1 进入接口RPF接口
Outgoing interface list: 出接口
TenGigabitEthernet 3/2 (1)
(210.34.130.27, 224.3.1.3), uptime 00:30:18, stat expires 00:03:01
Owner PIMDM, Flags: TF
Incoming interface: TenGigabitEthernet 3/1
Outgoing interface list:
VLAN 125 (1)
VLAN 151 (1)
VLAN 123 (1)
VLAN 124 (1)
Ruijie# show ip pim dense-mode mroute(协议表)
PIM-DM Multicast Routing Table
(1.1.1.111, 229.1.1.1)
MRT lifetime expires in 205 seconds
RPF Neighbor: 50.50.50.1, Nexthop: 50.50.50.1, VLAN 4 RPF检查
Upstream IF: VLAN 4
Upstream State: Pruned, PLT:200
Assert State: NoInfo
Downstream IF List:
FastEthernet 0/45:
Downstream State: NoInfo
Assert State: Loser, AT:170
上面的例子列出了(1.1.1.111, 229.1.1.1)的表项情况,其中MRT 老化时间为205 秒。RPF邻居为50.50.50.1,下一跳为50.50.50.1,到达下一跳的出口为VLAN4。表项的上游接口
为VLAN4,此时处于Pruned 状态,表示表项没有下游转发出口。下游接口有FastEthernet0/45,处于NoInfo 状态,并且接口的Assert 状态处于Loser,FastEthernet 0/45 不在转
发出口中。
重点关注1.表项是否建立 2. 入接口是否符合预期 3. 是否有转发接口
若表项未建立,需要进行排查:
PIM邻居是否正常show ip pim dense-mode neighbor/show ip pim dense-mode interface/show ip mvif
PIM报文发送与接收是否正常(捉包或debug) show ip pim dense-mode track/debug ip pim dense-mode all/各参数
PIM-SM的查看方法:
PIM存在2棵树,一个SPT为组播源到RP的路径,一棵树为RPT为组播目标到RP的树。
RPT树上节点的多播路由表和SPT上节点的多播路由表有所差别。由于RPT是可以许多源共享的一棵树,所以其协议路由表项为(*,G)模式(内部包含RP信息)。RP到源之间的SPT上的节点路由表项是(S,G)模式。RP上则同时有(*,G)[RPFnexthop为0.0.0.0]和(S,G)的表项。
ruijie#show ip mroute(转发表)
(219.229.134.145, 239.202.0.5), uptime 00:09:14, stat expires 00:02:07
Owner PIMSM, Flags: TFR
Incoming interface: VLAN 50
Outgoing interface list:
VLAN 25 (1)
VLAN 27 (1)
VLAN 30 (1)
VLAN 31 (1)
ruijie#show ip pim sp mr(协议表)
IP Multicast Routing Table
(*,*,RP) Entries: 0
(*,G) Entries: 2
(S,G) Entries: 1
(S,G,rpt) Entries: 1
FCR Entries: 0
REG Entries: 0
(*, 237.1.1.0)
RP: 192.16.57.48
RPF nbr: 0.0.0.0 //表明自己RP
RPF idx: None
Upstream State: JOINED
(192.16.57.49, 237.1.1.0)
RPF nbr: 0.0.0.0 //表明自己是组播源DR
RPF idx: None
SPT bit: 1
Upstream State: JOINED
kat expires in 48 seconds
(192.16.57.49, 237.1.1.0, rpt) //根据(*,G)和(S,G)综合生成的表项
RP: 192.16.57.48
RPF nbr: 0.0.0.0
RPF idx: None
Upstream State: NOT PRUNED
(S,G,rpt)用来表示 是否需要从rpt接收,当rpt的入口和 spt的入口不一样的时候,进行spt切换会用到。
若协议表项未建立,需要进行排查:
PIM邻居是否正常show ip pim sparse-mode neighbor [detail] show ip pim sparse-mode interface/show ip mvif
查看是否有RP映射show ip pim sparse-mode rp mapping
查看BSR信息show ip pim sparse-mode bsr-router
PIM报文发送与接收及处理机制是否正常(捉包或debug)show ip pim sparse-mode track/debug ip pim sparse-mode(众多选项,例如packets/event/state/nsm/mfc/all)
ip mroute表项建立后,转发异常,可进行如下排查
Show msf msc
debug msf 获取信息
clear ip mroute 重新观察表项生成情况
d.步骤4 查看接入交换机IGMP-Snooping表项是否建立
IGMP Snooping可以从有效抑制组播数据在二层网络中的扩散,当不使用IGMP Snooping功能时,组播被当做广播在VLAN内进行转发,当使用IGMP Snooping时,则只有有点播需求的用户端口才会收到相应的数据。如果不配置SNP功能组播正常,使用SNP后组播故障,则需重点排查SNP表项生成的问题。
查看表项
Ruijie#show ip igmp snooping gda-table
Multicast Switching Cache Table
D: DYNAMIC
S: STATIC
M: MROUTE
(*, 224.1.1.1, 100):
VLAN(100) 2 OPORTS:
GigabitEthernet 0/13(M)
GigabitEthernet 0/22(D)
若表项未建立,需要进行排查:
网关上show ip igmp group,debug ip igmp events或捉包查看IGMP报文收发情况;
客户端pc上捉包查看igmp报文收发情况;
接入交换机上执行debug igmp-snp event和debug igmp-snp packets (debug igmp-snp msf可选)
e.步骤5 如经过以上排查依然无法定位原因。请收集如下信息并提交到4008-111-000
客户组播应用模型;
设备配置;
设备上的组播表项show的相关信息;
按照以上1-4步骤排查的相关debug信息;
按照以上1-4步骤排查相关的捉包数据。