当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于序列比对的二进制未知协议报文格式划分方法技术

技术编号:19266744 阅读:50 留言:0更新日期:2018-10-27 04:12
本发明专利技术公开一种基于序列比对的二进制未知协议报文格式划分方法,它包含如下主要步骤:预处理得到单一类型的协议序列集合;设置结果序列;对协议序列两两进行全局序列比对和局部序列比对;合并全局序列比对结果;将局部序列比对结果记作相似度;将比对结果整合到结果序列中;根据结果序列进行报文格式划分等。本发明专利技术相比采用层次聚类等方法的方案,算法时间复杂度更低,也可以有效改善现有方案中在序列比对时由于插入过多空格导致字段位置滑动的问题,具有较好的准确率和实用性。

【技术实现步骤摘要】
一种基于序列比对的二进制未知协议报文格式划分方法
本专利技术属于网络协议分析
,具体涉及一种基于序列比对的二进制未知协议报文格式划分方法。
技术介绍
1967年,英格兰国家物理实验室的R.A.Scantleburry和K.A.Bartlett在一份备忘录中最早把“protocol”这个英文单词用于描述数据通信的过程,现如今,各种标准化组织、网络通信技术方案提供者、网络运营商等纷纷制定了相应的公开协议。顾名思义,此类协议规格公开,使用的数据格式也属于已知范畴,如手机APP与后台交互时最常使用的超文本传输协议,和在家用路由器中配置地址时使用的动态主机配置协议等。与此同时,出于商业利益或者军事政治领域敏感信息保密等目的,或者对于卫星、雷达、无人机等特殊设备而言,有时候设备间进行通信的协议规格不方便公开,于是产生了适用于此环境的私有协议。从网络流量的角度看,私有协议基本上都是以“未知流量”的形式存在,即以无法定义协议种类,也无法从中获取到协议信息的数据流量的形式存在,故也称之为未知协议。目前国内外已有一些基于网络流量进行私有协议报文格式推断的研究成果。PI项目提出首先使用动态规划的Sm本文档来自技高网...

【技术保护点】
1.一种基于序列比对的二进制未知协议报文格式划分方法,其特征在于:依次包括以下步骤:(1)通过对获取的网络流量进行预处理,得到单一类型的协议序列集合,预处理包括特征提取、特征筛选和聚类;(2)初始化一条记录比对结果的序列,将该序列的初始值都设为零;(3)对协议序列集合中的序列两两进行局部序列比对和全局序列比对,具体过程为:(3.1)对于每一条协议序列,都需要和集合中与自身不完全相同的所有协议序列进行一次全局序列比对和一次局部序列比对;(3.2)使用Needleman‑Wunsch序列比对算法进行全局序列比对,并将比对结果按规则融合为一条序列;(3.3)使用Smith‑Waterman序列比对算...

【技术特征摘要】
1.一种基于序列比对的二进制未知协议报文格式划分方法,其特征在于:依次包括以下步骤:(1)通过对获取的网络流量进行预处理,得到单一类型的协议序列集合,预处理包括特征提取、特征筛选和聚类;(2)初始化一条记录比对结果的序列,将该序列的初始值都设为零;(3)对协议序列集合中的序列两两进行局部序列比对和全局序列比对,具体过程为:(3.1)对于每一条协议序列,都需要和集合中与自身不完全相同的所有协议序列进行一次全局序列比对和一次局部序列比对;(3.2)使用Needleman-Wunsch序列比对算法进行全局序列比对,并将比对结果按规则融合为一条序列;(3.3)使用Smith-Waterman序列比对算法进行局部序列比对得到序列相似度,并设置空位匹配和不匹配两种情况下的基础值分别为1和2;(4)根据步骤(3.2)和步骤(3.3)中得到的融合序列、序...

【专利技术属性】
技术研发人员:秦中元陆凯
申请(专利权)人:东南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1