一种HSMS头部信息丢失的SECS2数据包识别方法技术

技术编号:32021801 阅读:70 留言:0更新日期:2022-01-22 18:42
本发明专利技术属于通信网络技术领域,具体为一种HSMS头部信息丢失的SECS2数据包识别方法。本发明专利技术包括如下步骤:建立HashMap对会话链接状态信息进行存储,读入未知数据包,根据数据包五元组查找会话信息,若不能直接判定则进入主体判定过程,先检测数据包是否具有HSMS头部,在不具有HSMS头部的情况下,尝试去查找一个切入点枚举值,判断在此枚举值之后的数据是否都符合SECS2数据的特征;数据包扫描识别后,结合占比和权值两个维度对数据包进行最终判定,得到结果后再对会话信息进行更新,方便下一次的判定。本发明专利技术保证了识别的精准和效率;基于本方法实现的会话状态管理器、数据识别器、综合评定器三个部分,涵盖协议识别功能。涵盖协议识别功能。涵盖协议识别功能。

【技术实现步骤摘要】
一种HSMS头部信息丢失的SECS2数据包识别方法


[0001]本专利技术属于通信网络
,具体涉及HSMS头部信息丢失的SECS2数据包识别方法。

技术介绍

[0002]随着网络技术的发展,互联网业务类型也日益走向多元化,在常规的流量识别中,可以针对数据包头部格式进行数据流量的识别,当头部信息丢失,检测网络流量类型的效率将大幅降低。在这种情况下,精准识别每种业务类型,也就是识别每种网络流量的类型,成为网络学术研究和部署运营的关注重点。
[0003]网络流量是记录和反映网络及其用户活动的重要载体,网络流量识别可用于网络态势的评估、应用程序的发展分析以及精细化运营等。对于无固定TCP端口的应用层协议,应用层的头部一般位于连接或交互会话的开始阶段,而协议最鲜明的特征在应用层协议的头部,例如HTTP协议(GET、POST操作指令)、SMTP协议(EHELO、MAIL FROM,RCPT TO等指令)。而当传输应用层协议的数据负载时,明显的协议特征已经不存在,即若对于随机截获的一段数据包,很有可能并不具有明显的协议特征,这使得传统的流量识别本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种HSMS头部信息丢失的SECS2数据包识别方法,其特征在于,具体步骤如下:步骤1:使用HashMap存储会话连接的信息和状态,将未知包读入,在HashMap中查找是否有这条连接的信息;如果没有,则新建一个结点,对这条连接进行存储;如果有,则查看其状态:当出现下列情况,判定后续数据包为SECS2数据包——

前面的数据包中,已经拿到了HSMS头部,且连接还未关闭;

前面的数据包已经被判定为SECS2数据段,且连接还未关闭;否则,进入下一步;步骤2:对未知包进行初步检测,判别其是否具有HSMS头部;如果有,可以直接判定为SECS2数据包,在HashMap中进行记录,直接跳入结果输出步骤;否则进入步骤3,进行判定;步骤3:对于SECSII数据包的格式进行判定;截取未知数据包的载荷PAYLOAD,对单字节逐个扫描,寻找第一个枚举值作为判定切入点,对此枚举值提取长度信息,跳过长度进行下一轮枚举值匹配,直至边界或跳出边界;若匹配中出现某字节不是应当出现的枚举值,说明之前的切入点Byte有误,跳回并继续寻找;匹配结束反馈权值,进入步骤4;具体流程为:步骤301:对未知数据包进行截取,循环读取未知数据包,对未知数据包首先进行包的预处理,提取出数据内容存放到缓存中,将缓存内容作为一段普通的文本;步骤302:对数据包的载荷PAYLOAD进行单字节的逐个扫描,寻找第一个可能是SECSII数据中类型字段的字节,该字节的值属于一个枚举值集合,并从该字节中提取长度和类型信息;步骤303:根据步骤302提取的长度和类型信息,进行跳跃识别和判定,若某次跳跃中发现,下一个枚举值没有正确出现,则认为初始枚举值判断错误,回到初始枚举值后一位置继续进行步骤302操作;步骤304:当跳跃到边界或跳出边界都符合枚举值规律,则认为切入点寻找正确;若跳跃到边界或跳出边界依旧未发现一段数据符合设定的SECS2规律,则认为该数据段不可能属于SECS2数据,对符合SECS2数据进行占比统计,并进行权值计算,进入步骤4;其中,具体寻找切入点枚举值以及跳跃识别的方法如下:逐个字节扫描数据包的PAYLOAD部分;提取单个字节的3

8bit,若出现枚举值,将其作为切入点,提取该字节的1

2bit,作为长度字节信息l,即后续l长度为数据的长度信息L;若该枚举值表示数据为ASCII码,则对L长度的数据进行类型的识别,否则,直接跳过L长度不进行识别;当ASCII码类型识别成功,则评定时给予更高的权值;步骤4:对数据包进行逐字节扫描后,对该数据包为SECS2数据包的概率进行两个维度的综合评定,给出两个维度的判定结果,以及综合判定的结果,判定结束。2.根据权利要求1所述的方法,其特征在于,步骤1中:所述使用HashMap存储会话链接信息和状态,包括:设计HashMap结点的数据结构,以数据包的五元组:源IP地址,源端口号,目的IP地址,目的端口,会话ID,进行两字节异或的方式作为HashK...

【专利技术属性】
技术研发人员:吴承荣伍鹏唐璇张志华蔡骏飞
申请(专利权)人:中芯国际集成电路制造上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1