一种基于自学习的深度报文解析系统技术方案

技术编号：22534878 阅读：23 留言：0更新日期：2019-11-13 11:02

本发明专利技术公开了一种基于自学习的深度报文解析系统，属于数据处理技术领域，包括：生成端和运行端，生成端包括：第一采集模块，第一解析模块，第一学习模块，第一学习模块具体包括：训练单元；上述技术方案的有益效果是：通过增加学习中枢，能够对现有网络环境中的数据进行机器学习，并把学习成果变为特征模型反馈到现有的特征库中，使特征库具备了自我更新的能力，且能与应用程序的更新速度保持同步，解决了现有技术中特征库维护量大，消耗的人力和资源大的问题，同时系统通过学习、反馈、再学习的过程，不断对现有的特征库进行自我优化，从而大大提高了特征识别的精确度。

A deep message parsing system based on self-learning

The invention discloses a deep message analysis system based on self-learning, belonging to the technical field of data processing, including: generation end and operation end, generation end including: first acquisition module, first analysis module, first learning module, and the first learning module specifically including: training unit; the beneficial effect of the above technical scheme is: through adding Learning Center, the existing network can be The data in the network environment is used for machine learning, and the learning results are transformed into feature models and fed back to the existing feature library, which enables the feature library to have the ability of self updating and keep pace with the update speed of the application program, and solves the problems of large maintenance and consumption of human and resources in the existing technology. At the same time, the system uses the process of learning, feedback and relearning To improve the accuracy of feature recognition, we constantly optimize the existing feature library.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自学习的深度报文解析系统
本专利技术涉及数据处理
，尤其涉及一种基于自学习的深度报文解析系统。
技术介绍
DPI(深度报文解析)是一种基于数据包的深度检测技术，针对不同的网络应用层载荷进行深度检测，通过对报文的有效载荷检测决定其合法性，DPI深度报文解析系统在现有网络环境中广泛使用，该系统主要用于识别应用程序，识别虚拟身份，识别网络内容，对网络进行流量监控等
现在的互联网环境中，手机和电脑的应用程序种类繁多，层出不穷且更新速度快，特征库的更新无法保持同步，各应用程序之间进行网络通讯产生的数据量巨大，对其进行深度报文解析需要投入大量的人力进行特征库的更新和维护，耗费大量的人力资源的同时数据提取的精确度也并不是很高。
技术实现思路
根据现有技术中存在的上述问题，提供一种具备自我学习功能的深度报文解析系统，通过增加学习中枢，能够对现有网络环境中的数据进行机器学习，并把学习成果变为特征模型反馈到现有的特征库中，使特征库具备了自我更新的能力，且能与应用程序的更新速度保持同步，解决了现有技术中特征库维护量大，消耗的人力和资源大的问题，同时系统通过学习、反馈、再学习的过程，不断对现有的特征库进行自我优化，从而大大提高了特征识别的精确度。上述技术方案具体包括：一种基于自学习的深度报文解析系统，其中包括生成端和运行端，所述生成端连接所述运行端，所述生成端包括：第一采集模块，用于抓取网络中的数据报文；第一解析模块，连接所述第一采集模块，所述第一解析模块根据一预设的第一特征库对所述数据报文进行特征标记，并根据标记结果对所述数据报文进行分类存储，输出一分类结果；...

【技术保护点】
1.一种基于自学习的深度报文解析系统，其特征在于，包括生成端和运行端，所述生成端连接所述运行端，所述生成端包括：第一采集模块，用于抓取网络中的数据报文；第一解析模块，连接所述第一采集模块，所述第一解析模块根据一预设的第一特征库对所述数据报文进行特征标记，并根据标记结果对所述数据报文进行分类存储，输出一分类结果；第一学习模块，连接所述第一解析模块，所述第一学习模块包括：训练单元，用于根据所述分类结果，将分类存储且进行特征标记的所述数据报文作为训练数据，对一特征识别模型进行第一机器学习，以形成并保存一包括所述数据报文的数据特征的第二特征库，应用所述第二特征库可对所述数据报文进行特征识别；所述运行端中包括：第二采集模块，用于抓取网络中的数据报文；第二解析模块，连接所述第二采集模块，读取所述生成端保存的所述第二特征库，对所述第二采集模块抓取的所述数据报文进行特征解析，并输出解析结果；输出模块，连接所述第二解析模块，用于将所述解析结果输出给用户使用。

【技术特征摘要】
1.一种基于自学习的深度报文解析系统，其特征在于，包括生成端和运行端，所述生成端连接所述运行端，所述生成端包括：第一采集模块，用于抓取网络中的数据报文；第一解析模块，连接所述第一采集模块，所述第一解析模块根据一预设的第一特征库对所述数据报文进行特征标记，并根据标记结果对所述数据报文进行分类存储，输出一分类结果；第一学习模块，连接所述第一解析模块，所述第一学习模块包括：训练单元，用于根据所述分类结果，将分类存储且进行特征标记的所述数据报文作为训练数据，对一特征识别模型进行第一机器学习，以形成并保存一包括所述数据报文的数据特征的第二特征库，应用所述第二特征库可对所述数据报文进行特征识别；所述运行端中包括：第二采集模块，用于抓取网络中的数据报文；第二解析模块，连接所述第二采集模块，读取所述生成端保存的所述第二特征库，对所述第二采集模块抓取的所述数据报文进行特征解析，并输出解析结果；输出模块，连接所述第二解析模块，用于将所述解析结果输出给用户使用。2.根据权利要求1所述的基于自学习的深度报文解析系统，其特征在于，所述第一学习模块还包括：清洗单元，连接所述训练单元，用于对所述分类结果进行数据清洗。3.根据权利要求1所述的基于自学习的深度报文解析系统，其特征在于，所述第一特征库为现...

【专利技术属性】
技术研发人员：裴亚可，曹瑜，
申请(专利权)人：上海寰创通信科技股份有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人