dhcp服务异常怎么修复(解决dhcp服务异常的正确方式)

dhcp服务异常怎么修复(解决dhcp服务异常的正确方式)

2021

前言

01

了解DHCP用户上线

发现阶段,即DHCP客户端寻找DHCP服务器的阶段。DHCP客户端以广播方式发送DHCP DISCOVER报文,只有DHCP服务器才会进行响应。

1.2 DHCP典型组网

DHCP基本架构网如图1-2所示:

图1-2DHCP基本架构图

DHCP中继不是必须的角色。只有当DHCP客户端和DHCP服务器不在同一网段内时,才需要DHCP中继进行报文的转发。

02

故障现象

03

故障处理流程

按照图1-5中所示,BRAS DHCP用户处于未上线状态,可能是以下原因:

DHCP用户尝试上线失败。

DHCP用户上线成功之后被下线。

DHCP用户被抑制。

DHCP用户报文未上送成功。

具体请按照以下流程图进行故障处理:

首先查看用户上线失败原因。

如果无显示,则考虑是用户成功上线之后被下线,此时可查看用户下线原因。

如果两者都无法查出原因,则可能是用户被抑制,可以查看用户是否被抑制,该种情况无法通过前两者的查询命令查出。

如果用户没有被抑制,此时可以查看协议报文在上送的过程中是否存在丢失的情况。

DHCP用户报文的上送路径为:用户—>设备—>DHCP组件(接口板)—>DHCPACC组件。可以从报文上送的最后一个阶段向前定位,查看相关的DHCP组件是否收到报文,如果没有收到报文,则需要排查报文是否上送至设备。排查出的报文丢失阶段之后并采取相应措施。

图1-5DHCP用户接入故障诊断流程图

04

故障处理步骤

1、执行命令display aaa online-fail-record查看用户上线失败原因。

<HUAWEI> display aaa online-fail-record ————————————————————————— User name : test@huawei Domain name : huawei User MAC : 00e0-aecf-8899 User access type : IPoE User interface : GigabitEthernet1/0/1.1 User Pe Vlan : 99 User Ce Vlan : 99 User IP address : – User ID : 233 User authen state : Authened User acct state : AcctIdle User author state : AuthorIdle User login time : 2020-09-04 15:14:14 Online fail reason : The domain has not bound ip-pool or ipv6-pool ————————————————————————— Are you sure to display some information? [Y/N]:

Online fail reason字段显示的是用户上线失败的原因。User access type为用户类型,此时显示IPoE,即为BRAS DHCP用户。

如果DHCP用户报文已经上传到BRAS业务模块,此处会通过Online fail reason字段生成用户上线失败原因。根据原因可以大概判断故障,为后面的具体定位提供指引,常见的失败原因详细见表1-1。

如果用户没有出现在上线失败记录,则用户并没有上线,请参考步骤2查看用户下线原因。

表1-1DHCP用户常见上线失败原因

2、执行命令display aaa offline-record查看用户下线原因。

如果通过步骤1没有查看到上线失败原因,可能是用户上线成功之后又被下线了,此时通过执行display aaa offline-record命令查看用户下线原因进行定位。

<HUAWEI> display aaa offline-record ——————————————– User name : test@huawei Domain name : huawei User MAC : – User access type : IPoE User access interface: GigabitEthernet1/0/1.1 User Pe Vlan : 99 User Ce Vlan : 99 User IP address : 10.1.1.1 User ID : 2094370 User authen state : Authened User acct state : AcctReady User author state : AuthorIdle User login time : 2021-03-11 20:26:47 User offline time : 2021-03-12 20:27:28 User offline reason: AAA cut command ——————————————– Are you sure to display some information? [Y/N]: y ——————————————– User name : test@huawei Domain name : huawei User MAC : – User access type : IPoE User access interface: GigabitEthernet1/0/1.1 User Pe Vlan : 99 User Ce Vlan : 99 User IP address : 10.1.1.2 User ID : 0 User authen state : Authened User acct state : AcctReady User author state : AuthorIdle User login time : 2021-03-11 19:26:47 User offline time : 2021-03-11 20:27:28 User offline reason: User request to offline ——————————————– Are you sure to display some information? [Y/N]: n

如果DHCP用户上线之后又被下线,会通过User offline reason字段生成用户下线原因。根据原因可以大概判断故障,为后面的具体定位提供指引。常见的用户下线原因详见表1-2

表1-2DHCP用户常见下线原因

如果无法通过display aaa offline-record命令查看用户下线原因,则需要排查用户是否被抑制,请参考步骤3。

3、查看用户是否被抑制。

在系统视图下执行命令display dhcp chasten-user slot 1 mac-address 00e0-aecf-8899 查看用户是否被抑制:

如果用户被抑制,根据State字段显示的信息,RESTRAIN表示用户处于被抑制状态,只需稍后重新拨号上线即可。

<HUAWEI> system-view [~HUAWEI] display dhcp chasten-user slot 1 mac-address 00e0-aecf-8899——————————————————————————- IfIndex: 5697 PE VLAN/CE VLAN: 1004/- UserMac: 00e0-aecf-8899State: RESTRAINRecvPktTime: 2021-03-16 16:27:32 RecvPktCount: 0 RecvAuthenCount: 0 TotalRestrainPkt: 0 TotalPassPkt: 0 ——————————————————————————- Total User Num: 1

如果用户没有被抑制,State字段显示为CHECK,说明用户没有被抑制。此时考虑可能是协议报文在上送的过程中存在丢失的情况,可以排查用户的报文是否达到BRAS模块,具体请参考步骤4。

<HUAWEI> system-view [~HUAWEI] display dhcp chasten-user slot 1 mac-address 00e0-fc12-3456——————————————————————————- IfIndex: 5697 PE VLAN/CE VLAN: 1004/- UserMac: 00e0-fc12-3456State: CHECK RecvPktTime: 2021-03-16 16:27:32 RecvPktCount: 3 RecvAuthenCount: 0 TotalRestrainPkt: 0 TotalPassPkt: 3 ——————————————————————————- Total User Num: 1

4、查看DHCP相关组件是否收到报文。

排查用户的报文是否到达BRAS模块,即排查到协议报文丢失的阶段,再根据丢弃的原因进行定位。

DHCP用户上线报文的上送路径为:用户——>设备——>DHCP组件(接口板)——>DHCPACC组件。因此,接下来从报文上送的最后一个阶段开始定位:

执行display dhcp-access statistics packet命令查看产品DHCPACC组件是否收到报文

<HUAWEI> display dhcp-access statistics packet ————————————————————————- Received Packets ————————————————————————- Received from Clients : 8 Discover Packets : 0 Request Packets : 3 BootP Request : 0 Select Request : 0 Reboot Request : 0 Renew Request : 0 Rebind Request : 0 Decline Packets : 0 Release Packets : 2 Inform Packets : 0 Received from Servers : 6 Offer Packets : 3 Ack Packets : 3 Nak Packets : 0 Forcerenew Packets : 0 Received Invalid Packets Discover Packets Forbidden by ACL : 0 Request Packets Forbidden by ACL : 0 Client Packet Check Error Option Error : 0 Hops Error : 0 Htype Error : 0 Length Error : 0 MC Error : 0 NULL MAC : 0 Sname Error : 0 BootFile Error : 0 Server Packet Check Error Option Error : 0 Access Limit : 0 Invalid Server IP In Offer : 0 Invalid Server IP In Nak : 0 Invalid Server IP In NakNew : 0 Htype Error : 0 Length Error : 0 MC Error : 0 Sname Error : 0 BootFile Error : 0 Conflict IP In Offer : 0 Conflict IP In Ack : 0 ————————————————————————- Sent Packets ————————————————————————- Send to Clients : 0 Offer Packets : 0 Ack Packets : 0 Nak Packets : 0 Send to Servers : 0 Discover Packets : 0 Request Packets : 0 Release Packets : 0 Decline Packets : 0 ————————————————————————-

回显中的Discover Packets字段表示DHCP Discover报文上送到DHCPACC组件计数。

此时如果有计数增长,表示报文已上送至DHCPACC组件。可以执行命令trace enable打开用户的业务跟踪功能,再执行命令trace access-user创建业务跟踪对象,然后执行命令terminal debugging和terminal monitor打开命令行用户终端显示功能,搜集业务跟踪的消息并执行步骤7联系技术支持工程师。

此时若没有计数增长,参考步骤4b继续定位报文丢失阶段。

在诊断视图下执行display dhcp ipoe statistics packet命令查看DHCP接入模块是否收到报文。

<HUAWEI> system-view[~HUAWEI] diagnose[~HUAWEI-diagnose] display dhcp ipoe statistics packet————————————————————————- DHCPv4 Received Packets————————————————————————- From server : 0 From client : 8————————————————————————- DHCPv4 Sent Packets————————————————————————- To server : 0 To client : 6————————————————————————- DHCPv6 Received Packets————————————————————————- From server : 0 From client : 0————————————————————————- DHCPv6 Sent Packets————————————————————————- To server : 0 To client : 0————————————————————————- Discard Packets————————————————————————- Hops error : 0 Htype error : 0 Hlen error : 0 Chaddr error : 0 Chaddr zero : 0 Same mac : 0 Sname error : 0 Bootfile error : 0 Option error : 0 Bootp packet : 0 Discover packet acl error : 0 Request packet acl error : 0 DHCPv4 chasten : 0 DHCPv6 chasten : 0————————————————————————-

如回显所示,From Client 字段表示从终端收到的报文计数。

如果此时计数有增长,表示DHCP接入模块收到了报文。此时可以:

通过执行命令display dhcp ipoe statistics message,查看DHCP接入模块的相关统计信息,如果DHCPv6 From Client有增长,但是SEND_TO_BRASUM-DHCPv4没有计数,说明DHCP接入模块收到了报文,但是没有发送给DHCPACC组件。请参考步骤7联系技术工程师。

通过执行命令display dhcp partner-info查看DHCP组件与其它组件的关系和管道建立情况,通过DHCPACC组件的CID找到对应接口板上DHCP组件与DHCPACC组件的管道是否建立成功。请参考步骤7联系技术工程师。

如果计数没有增长,请参考步骤5继续寻找报文丢弃点。

5、 检查用户报文是否上送至设备。

在诊断视图下执行display fe slot slot-id [ fe-id fe-id ] statistics discard命令查看丢弃报文计数。

<HUAWEI> system-view[~HUAWEI] diagnose[~HUAWEI-diagnose] display fe slot 1 fe-id 0 statistics discard—————————————————————— ID Packet Name 0 0x00000000-00271439 EXCP_ID_UNKNOW 179 0x00000000-0001cd90 EXCP_ID_CROSSBOARD_MACDEL 2236 0x00000000-2e726937 CAUSE_E_L2MC_LRNONLY_PKT_DROP 2681 0x00000000-0518a093 CAUSE_E_USI_SYN_NORMAL_DROP 2682 0x00000000-0518a093 CAUSE_E_USI_UPDATE_CNT 2966 0x00000000-00017ac3(00096963) CAUSE_E_PW_AWPP_ERROR_STAT 3091 0x00000000-1754e710 CAUSE_B_TELEMETRY_PAC_TOCP 3326 0x00000000-00271439 CAUSE_B_MAC_TIMER_SYN_MSG_DROP

其中ID列为报文的Cause ID,Packet列为报文的计数(十六进制),Name列为标识的对应报文。如果此处有报文丢包,会有对应的计数增加,可以多执行此次该命令,查看是哪个丢弃的原因的计数在增加。如果计数没有增加,说明报文没有被丢弃。请参考步骤5b。

在诊断视图下执行命令display fe slot 1fe-id 0 statistics to-cp查看上送报文计数。

<HUAWEI> system-view [~HUAWEI] diagnose [~HUAWEI-diagnose] display fe slot 1 fe-id 0 statistics to-cp ID Packet Name 93 0x00000000-00001224 EXCP_ID_IPV4_OSPFDD_TO_CP 190 0x00000000-00000014 EXCP_ID_IPV4_ARP_REQUEST 191 0x00000000-00000015 EXCP_ID_IPV4_ARP_REPLY

其中,ID列为报文的Causer ID,Packet列为报文的计数(十六进制),Name列为标识的对应报文。此时如果报文上送设备,对应的计数会有增加。常见的上送的DHCP报文如表1-3所示:

表1-3常见的上送的DHCP报文标识表

此时如果对应的报文计数没有增加,则说明报文没有成功上送至设备,请参考步骤6。

6、 检查设备故障。

如果以上情况均定位不到原因,请检查以下配置:

确认设备物理连接均正常。

确认网络配置正确。

7、 如果检查结束,故障仍然无法排除,请联系技术支持工程师。

05

总结

当DHCP用户未上线时,通过命令行查询用户上线失败和下线的原因,以及用户是否被抑制。如未能初步检查出DHCP上线失败和下线的原因,且用户并未被抑制,可从DHCP报文上送阶段依次排查,定位出是哪个阶段报文上送失败,采取对应排障的措施。

赠书量:两本

●书目简介

本书主要包括基础安全设施建设、安全自动化系统建设、业务安全体系建设三个部分。第一部分介绍当进入一个安全建设空白或基本为零的企业时,如何着手规划并一步步建成较为完善的安全体系;第二部分主要介绍安全自动化,帮助大家掌握开源的二次开发思路,设计适合企业自身特点的安全系统;第三部分介绍业务安全体系建设,包括互联网黑产攻击手法、风控系统建设方案和业务安全风险防控体系建设实践。

百度、腾讯、360、趋势科技等专家面对面交流网络安全热点问题的成果荟萃,经典教程 黑客攻防全能视频 计算机硬件管理手册 Windows文件管理手册 Linux命令应用大全共同集合而成的“网络安全超值学习套餐”,你确定不来了解一下?

《黑客攻防从入门到精通(全新升级版)》,在攻与防的对立统一中寻求黑客攻防的全新突破,认准这本书就对啦!

●赠书条件

回复“819”即可参与!

dhcp服务异常怎么修复(解决dhcp服务异常的正确方式)

2021

发表评论

登录后才能评论