组网及说明
/
告警信息
/
问题描述
设备型号:S9850-4C
设备版本:Version 7.1.070, Release 6635
问题:有两台S9850交换机采用DRNI+VRRP对接服务器,出现设备不响应服务器发送的单播ARP请求,直到arp彻底老化,服务器发出广播ARP请求服务器才学习到arp,导致期间出现短暂丢包的情况.
故障举例如下:服务器ip是10.102.198.200,
<NAT_Switch_I_FSKPL_4F08-07-05_9850-1>dis arp
Type: S-Static D-Dynamic O-Openflow R-Rule M-Multiport I-Invalid
IP address MAC address VLAN/VSI name Interface Aging Type
10.102.198.200 246e-9612-afc0 198 BAGG20 1198 D
在服务器TCP dum看到,单播发送的arp请求他们收不到回应,广播请求的时候,立刻有回应:
而在我们vrrp
master网关所在的设备上debug,看到确实只有广播报文,才是有回应arp
reply的
过程分析
经分析定位是软件问题,后面会出补丁解决,问题原因如下:
Vrrp+drni的场景,虚mac下发时候,如果是对端同步过来的DR mac,下发硬件的时候不带标记。
当drni设备是Vrrp主时: 下发为vrrp 虚mac
当drni设备是Vrrp备时: 下问题已定位,后面会出补丁解决,问题原因如下: Vrrp+drni的场景,虚mac下发时候,如果是对端同步过来的DR mac,下发硬件的时候不带标记。 当drni设备是Vrrp主时:下发为vrrp 虚mac 当drni设备是Vrrp备时:下发 为指向IPP口DRmac 当设备第一次是备时,底层会有指向IPP口DRmac, 不带硬件标记, 软表计数是1。 当设备从备变成主时,走先add再del流程,add时软表计数变为2,del时软表计数为1;软件认为底层有mac表项就直接返回,不下发硬件了。 导致底层硬件没有带标记,报文不能命中本地的硬件表项,导致softcar索引为30的协议acl匹配不上,所以无法上cpu。
当设备第一次是备时,底层会有指向IPP口DRmac, 不带硬件标记,软表计数是1。
当设备从备变成主时,走先add再del流程,add时软表计数变为2,del时软表计数为1;软件认为底层有mac表项就直接返回,不下发硬件了。
导致底层硬件没有带标记,报文不能命中本地的硬件表项,导致softcar索引为30的协议acl匹配不上,所以无法上cpu。
解决方法
1.配置发送免费arp,设备既会发实ip的arp也会发虚ip的arp,可以作为规避手段.: arp send-gratuitous-arp命令用来在接口上开启定时发送免费ARP功能。
2.发布补丁解决.