WX3510H旁挂S7506E上,核心交换机作为网关,通过DHCP给AP和终端下发地址。核心交换机下连多台S5130S的POE交换机,POE交换机下连多台WA5320。现在多台AP每隔一段时间就重启一次,反复上下线。
查看AP重启原因,提示:User soft reboot,无法判断出具体的故障原因。
===============display version===============
H3C Comware Software, Version 7.1.064, Release 2215P01
Copyright (c) 2004-2017 New H3C Technologies Co., Ltd. All rights reserved.
H3C WA5320 uptime is 0 weeks, 0 days, 0 hours, 11 minutes
Last reboot reason : User soft reboot
初步考虑的是POE交换机供电不足导致,关闭POE交换机的其他端口,只连接一台AP也会有重启现象,同时经过交换机产品线排查,POE交换机供电没有问题。
由于掉线相对齐整,如果供电没有问题,那可能的原因是与AC之间链路中断导致AP齐整掉线。排查互连设备,在核心交换机上发现了ARP地址冲突,表现如下:
%Dec 14 17:02:55:624 2017 hexin ARP/6/DUPIFIP:
Duplicate address 172.16.128.20 on interface Vlan-interface4093, sourced from 38ad-8e19-3920
经检查,该IP地址是AC的管理地址,对应的MAC地址为某台AP的地址。
在AC上查看配置及AP注册信息:
#
interface Vlan-interface4093
ip address 172.16.128.20 255.255.248.0
#
从上述的信息来看,其中有台AP的IP地址与AC的IP地址出现了冲突。此时我们找到了问题的所在:DHCP地址池及网关放在核心交换机上,设备上没有配置dhcp forbidden-ip。根据DHCP原理:缺省情况下,除DHCP服务器接口的IP地址外,DHCP地址池中的所有IP地址都参与自动分配。
AC上配置了固定IP,由于没有配置dhcp forbidden-ip,DHCP服务器将AC的IP地址分配给了其中某台AP,导致其他AP无法找到AC,从而注册不成功、反复重启。
在核心交换机上做如下配置:
dhcp server forbidden-ip 172.16.128.20
由于AC的地址并不是一直被分配给AP使用,所以ARP的冲突提示信息很少,比较难发现,给故障排查带来许多麻烦。所以在给设备做配置时,需要注意细节以及配置规范。