The invention discloses a universal extraction method of instant messaging protocol elements custom tag based language, realize the application layer data reorganization stage, message type recognition stage, protocol elements extraction stage and format the output stage through the platform, the stage is as follows: the application layer data reorganization stage: the restructuring of the application layer data, forming a complete data unit for the subsequent analysis phase extraction; message type recognition stage: data unit of application layer data reorganization stage reorganization message type recognition; protocol elements extraction stage: according to the message type recognition stage identify the types of messages are extracted from the various protocol elements; formatted output stage: Protocol elements of protocol elements extraction phase extraction the formatted output. The invention greatly reduces the workload of the development and maintenance, saves the time greatly, and can also reduce the impact of the customer's on-site use.
【技术实现步骤摘要】
基于自定义标签语言的即时聊天协议要素通用抽取方法
本专利技术涉及即时聊天协议要素通用抽取方法,特别是基于自定义标签语言的即时聊天协议要素通用抽取方法。
技术介绍
伴随互联网的发展,即时聊天协议越来越多,且更新频率越来越快,这给网络空间安全监控带来巨大的挑战。传统的即时聊天协议要素抽取方法,根据每种即时聊天协议的消息类型及消息格式定制一套包括应用层数据重组、消息类型识别、协议要素抽取和话单输出的代码,这需要大量的开发及维护工作量;每新支持一种即时聊天协议都需要重新编译和启动版本,对客户的现场使用有很大影响;同时各即时聊天协议抽取模块之间也会互相影响对方的稳定性,对整个协议要素抽取平台形成巨大影响。究其原因,主要是因为传统的即时聊天协议要素抽取方法都是根据各协议特点定制整套代码,并没有从宏观出发将协议要素抽取的各个阶段抽象成一个通用处理平台,没有将各阶段规则抽象成一套自定义标签语言,对即时聊天协议要素抽取进行通用处理和平台化管理。
技术实现思路
专利技术目的:本专利技术的目的是提供一种能够解决现有技术中存在的缺陷的基于自定义标签语言的即时聊天协议要素通用抽取方法。技术方案:本专利技术所述的基于自定义标签语言的即时聊天协议要素通用抽取方法,通过通用平台实现应用层数据重组阶段、消息类型识别阶段、协议要素抽取阶段和格式化输出阶段,各阶段如下:应用层数据重组阶段:对应用层数据进行重组,形成完整的数据单元供后续阶段进行分析抽取;消息类型识别阶段:对应用层数据重组阶段重组得到的数据单元进行消息类型识别;协议要素抽取阶段:根据消息类型识别阶段识别出的消息类型,对各协议要素进行抽 ...
【技术保护点】
基于自定义标签语言的即时聊天协议要素通用抽取方法,其特征在于:通过通用平台实现应用层数据重组阶段、消息类型识别阶段、协议要素抽取阶段和格式化输出阶段,各阶段如下:应用层数据重组阶段:对应用层数据进行重组,形成完整的数据单元供后续阶段进行分析抽取;消息类型识别阶段:对应用层数据重组阶段重组得到的数据单元进行消息类型识别;协议要素抽取阶段:根据消息类型识别阶段识别出的消息类型,对各协议要素进行抽取;格式化输出阶段:对协议要素抽取阶段抽取到的协议要素进行格式化输出。
【技术特征摘要】
1.基于自定义标签语言的即时聊天协议要素通用抽取方法,其特征在于:通过通用平台实现应用层数据重组阶段、消息类型识别阶段、协议要素抽取阶段和格式化输出阶段,各阶段如下:应用层数据重组阶段:对应用层数据进行重组,形成完整的数据单元供后续阶段进行分析抽取;消息类型识别阶段:对应用层数据重组阶段重组得到的数据单元进行消息类型识别;协议要素抽取阶段:根据消息类型识别阶段识别出的消息类型,对各协议要素进行抽取;格式化输出阶段:对协议要素抽取阶段抽取到的协议要素进行格式化输出。2.根据权利要求1所述的基于自定义标签语言的即时聊天协议要素通用抽取方法,其特征在于:所述应用层数据重组阶段中,根据重组规则将应用层数据进行重组,所述重组规则包括数据开始规则和数据结束规则。3.根据权利要求2所述的基于自定义标签语言的即时聊天协议要素通用抽取方法,其特征在于:所述数据开始规则包括关键字类型和协议头类型,其中:关键字类型:以固定位置的关键字作为数据开始部分;协议头类型:以一个协议头作为数据开始部分,该协议头无固定关键字但符合固定模式。4.根据权利要求2所述的基于自定义标签语言的即时聊天协议要素通用抽取方法,其特征在于:所述数据结束规则包括不拼包类型、长度固定类型、长度由值决定类型、长度由键值对决定类型和关键字类型,其中:不拼包类型:不需要进行拼包;长度固定类型:数据单元的长度固定;长度由值决定类型:数据单元的长度由数据的某个位置的值确定;长度由键值对决定类型:数据单元的长度由数据的某个键值对来确定;关键字类型:数据单元的长度不固定,但以某个关键字作为数据单元的结束。5...
【专利技术属性】
技术研发人员:王丽雪,王恒亮,
申请(专利权)人:南京茂毓通软件科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。