交换机
园区网交换机
数据中心与云计算交换机
中小网络精简型交换机
工业交换机
意图网络指挥官
无线
放装型无线接入点
墙面型无线接入点
智分无线接入点
室外无线接入点
场景化无线
无线控制器
小锐A系列
统一运维
身份管理
服务产品
运营商
政府
金融
互联网
电力能源
制造业
高教/职教
医疗卫生
交通
地产酒店文旅·连锁服务
公共安全
1、故障现象
启动ePortal服务成功,正常运行一段时间后,服务自动重启,甚至出现服务重启失败后宕机的情况。
2、故障可能原因
1) SQL Server数据库未限制内存
2) 接入设备配置与服务器记录的设备信息不一致
3) 服务器网卡参数配置
4) 接入设备是否支持降噪配置
3、故障处理流程
、
4、故障处理步骤
步骤1 排查SQL数据库是否限制内存
1. 首先,检查eportal服务器内存使用情况,打开任务管理器,如下图示:
2. 查看进程内存使用和内存使用总数,如下图示:
若内存使用数占用很高,且sqlservr.exe进程使用的内存接近2G,则说明数据库可能没有进行内存限制。
3. 如下图,打开SQL Server的数据库管理器工具,如下图示:
4. 选中SQL数据库,打开属性面板,如下图示:
5. 选择“内存”项,右侧面板出现服务器内存选项的参数配置信息,如下图示:
若服务器安装的32位的操作系统,最大内存限制为512M,开启AWE参数的情况下,最大内存限制为1024M。
若服务器安装的32位的操作系统,内存可不做限制。
6. 调整内存限制后,重启SQL数据库,使内存限制及时生效,如下图示:
步骤2 排查是否服务器异常检测机制导致服务重启
ePortal服务管理器自身附带服务状态检测机制的功能,一旦发现服务状态异常,就会自行发起服务重启操作。
1. 首先,确认ePortal服务异常重启或停止,与自身检测机制有关,查看ePortal日志管理,如下图:
日志信息说明,ePortal系统在“2012-11-29 16:44:56”服务停止了。
2. 若服务器异常重启,进入ePortal安装路径,查看conf目录下的monitor.xml,如下图:
打开monitor.xml文件,文件内容如下:(这段文本说明ePortal服务在“2012-11-29 16:38:50”通知服务管理器:服务运行正常。)
正常情况下,ePortal每隔1分钟就是更新monitor.xml文件,若服务管理器超过5分钟未收到更新通知,就自动重启ePortal服务。
3. 在ePortal1.41之前的版本,存在一个比较严重的故障,若ePortal记录的设备IP与实际设备不符,或设备突然长时间断电停用,会造成服务器自检机制异常,导致服务异常重启或宕机,该问题可通过以下步骤规避解决:
1) 进入ePortal系统的设备管理菜单,查看所有设备信息,如下图示:
2) 在ePortal服务器上,依次排查所有设备,通过ping设备IP,确认设备是否在用,可以正常访问;
3) 若设备不能访问,检查设备是否被下电被停用了,若是,请重新启动设备;
4) 若设备不能访问且设备运行正常,检查设备配置IP与ePortal记录是否一致,若不一致,请修改ePortal上对应设备的IP信息。
4. 该问题在ePortal1.41版本已解决,可升级到该版本彻底解决该问题。
排除服务器异常检测机制引起服务重启问题,若依然无法解决服务器重启问题,则进入下一步骤的排查。
步骤3 排查服务器系统补丁和网卡配置是否正确
1. 首先,检查ePortal服务器系统补丁。
1) 对于 Windows Server 2003 系统,一定要打上 KB950224 补丁,否则 SAM 可能会意外退出。
进入“开始” -- “设置”-- “控制面板”,
在控制面板窗口,打开“添加或删除程序”窗口,选择“显示更新”的选项,如下图:
查看系统补丁列表,若已经安装KB950224补丁,则系统补丁检查通过;否则登录微软网站下载该补丁,或联系4008111000索取补丁程序。
2) 对于 Windows Server 2008 系统,一定要打上 KB975808 补丁,否则 SAM 可能会意外退出。检查步骤同Windows Server 2003系统,不再重复说明。
注意:安装系统该补丁可能会重启系统,请事先与客户沟通是否允许重启服务器系统。
2. 其次,检查ePortal服务器网卡的高级配置,以Window2003系统为例(Window2008步骤基本一致),步骤如下:
1) 双击桌面右下角的 网卡图标,弹出网络属性窗口,如下图示:
2) 点击“属性”按钮,弹出网卡配置窗口,打开网卡“配置”信息,如下图:
3) 选择“高级”选项,参看网卡属性,如下图:
4) 将分载TCP系列选项(通常有5个)、记录链接状态、流量控制、中断节流率、等待链接、启用PME、智能关闭电源、唤醒设置等网卡高级参数,修改为“关闭”或“禁用”。
注意:不同类型网卡的属性可能不一样(本例是Intel网卡),若ePortal服务器网卡只有上述属性中的少数几个,那么就只修改该网卡支持的那些属性即可。
检查服务器系统补丁和网卡高级属性的要求,若依然无法解决服务器重启问题,则进入下一步骤的排查。
检查服务器的SQL Server数据库内存限制后,若依然无法解决服务器重启问题,则进入下一步骤的排查。
步骤4 排查接入设备是否支持降噪配置
在网络环境没有变化的情况下,若认证业务高峰期出现ePortal服务器CPU和内存占用都很高,甚至出现ePortal服务器不响应宕机的情况,需要检查web认证的接入设备是否支持降噪。
降噪是指接入设备屏蔽非浏览器发起的http请求,需要接入设备更新到特定软件版本才能支持。
按照以下步骤确认接入设备是否支持降噪配置:
1. 首先查看接入设备的软件版本信息,通过Console口登录接入设备,查看设备软件版本信息;
2. 若接入设备为交换机设备,进入特权模式,输入“show version”,如下;
查看software version信息,若软件版本低于RGOS 10.3版本,则交换机版本不支持web认证降噪,需要升级到最新版本,请联系4008111000索取最新版本信息。
3. 若接入设备为AC设备,进入特权模式,输入“show version”,如下;
查看software version信息,若软件版本低于RGOS 10.4(1T17)版本,则AC交换机版本不支持web认证降噪,需要升级到最新版本,联系4008111000协助处理。
4. 若接入设备为ACE设备,首先识别ACE硬件版本,若是ACEv5.0设备直接输入“show version”,如下;
查看version信息,若软件版本低于3.4.0版本,则AC交换机版本不支持web认证降噪,需要升级到最新版本。ACEv3.0不支持降噪功能,请先升级到ACEv5.0版本。具体ACE升级版本和操作步骤,请联系4008111000协助处理。
检查接入设备版本符合降噪配置的要求,若依然无法解决服务器重启问题,则进入下一步骤的排查。
步骤5 收集信息并联系4008111000协助处理
拨打4008111000寻求技术支持,收集如下故障信息,进行故障进一步处理。
1. ePortal软件版本号
登录ePortal系统,点击“关于系统”,弹出版本信息。如下图例:
2. ePortal服务器的配置
在服务器上,点击我的电脑--属性,截取服务器软硬件配置信息,如下图示:
进入“开始菜单”--“运行”,敲入CMD,进入命令窗口,输入systeminfo > c:\version.txt
3. 截取ePortal认证和系统的负载情况的截图
ePortal首页截图示例如下:
ePortal服务器进程和负载情况示意图: