The invention discloses a DPI traffic identification method, device and computer readable storage medium. The DPI traffic identification method obtains the test business name corresponding to the test business package and the test business package, decodes the test business package, obtains several CDR test record data, and then imports the test business name through the preset keyword Association algorithm. In this process, no manual analysis and labeling are needed. Then, according to the combination of keywords and CDR test record data in the test business package, the corresponding business flow of the test business is automatically matched and identified, which effectively reduces the identification time of the business flow and can quickly identify the business in the new business. Flow rate.
【技术实现步骤摘要】
一种DPI业务流量识别方法、装置与计算机可读存储介质
本专利技术涉及通信
,尤其涉及一种DPI业务流量识别方法、装置与计算机可读存储介质。
技术介绍
DPI(DeepPacketInspection,深度报文检测)技术是一种基于应用层的流量检测和控制技术,称为“深度包检测”。所谓“深度”是和普通的报文分析层次相比较而言的,普通报文检测仅分析IP包的4层以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型。而DPI除了对前面的层次分析外,还增加了应用层分析,识别各种应用及其内容。当IP数据包、TCP或UDP数据流通过基于DPI技术的带宽管理系统时,该系统通过深入读取IP包载荷的内容来对OSI七层协议中的应用层信息进行重组,从而得到整个应用程序的内容,然后按照系统定义的管理策略对流量进行整形操作。现有的DPI业务流量识别在业务测试和规则提取上都需要依赖人工手动实现,上线周期长,无法快速响应新业务识别业务流量的需求。
技术实现思路
本专利技术的目的是提供一种DPI业务流量识别方法、装置与计算机可读存储介质,在业务测试和规则提取上无需进行人工分析和标记,能够快 ...
【技术保护点】
1.一种DPI业务流量识别方法,其特征在于,包括:获取测试业务包和所述测试业务包对应的测试业务名称,并对所述测试业务包进行解码,得到若干条CDR测试记录数据;其中,任意一条CDR测试记录数据中包括URL字段、USER_AGENT字段和REFER_URI字段;通过预设的关键字联想算法对所述测试业务名称进行关键字提取,获取所述测试业务名称对应的关键字合集;将所述关键字合集与CDR测试记录数据中的URL字段、USER_AGENT字段和REFER_URI字段进行模糊匹配,将匹配成功的CDR测试记录数据标记为测试业务的业务流量。
【技术特征摘要】
1.一种DPI业务流量识别方法,其特征在于,包括:获取测试业务包和所述测试业务包对应的测试业务名称,并对所述测试业务包进行解码,得到若干条CDR测试记录数据;其中,任意一条CDR测试记录数据中包括URL字段、USER_AGENT字段和REFER_URI字段;通过预设的关键字联想算法对所述测试业务名称进行关键字提取,获取所述测试业务名称对应的关键字合集;将所述关键字合集与CDR测试记录数据中的URL字段、USER_AGENT字段和REFER_URI字段进行模糊匹配,将匹配成功的CDR测试记录数据标记为测试业务的业务流量。2.如权利要求1所述的DPI业务流量识别方法,其特征在于,所述通过预设的关键字联想算法对所述测试业务名称进行关键字提取,获取所述测试业务名称对应的关键字合集,具体包括:通过预设的包名联想算法爬取所述测试业务名称的测试业务包名,并提取所述测试业务包名的包名关键字;通过预设的中文联想算法获取所述测试业务名称的拼音测试业务名称,并提取所述拼音测试业务名称的拼音关键字;通过预设的英文联想算法获取所述测试业务名称的英文测试业务名称,并提取所述英文测试业务名称的英文关键字;通过预设的自然语言处理分词联想算法获取所述测试业务名称的测试业务名称分词,并提取所述测试业务名称分词的分词关键字;将所述包名关键字、拼音关键字、英文关键字和分词关键字进行集合,得到所述测试业务名称的关键字合集。3.如权利要求2所述的DPI业务流量识别方法,其特征在于,所述通过预设的包名联想算法爬取所述测试业务名称的测试业务包名,并提取所述测试业务包名的包名关键字,具体包括:通过NLP分词算法获取所述测试业务包名的包名分词列表;剔除所述包名分词列表中的公用词和符号,得到所述包名关键字。4.如权利要求2所述的DPI业务流量识别方法,其特征在于,所述通过预设的中文联想算法获取所述测试业务名称的拼音测试业务名称,并提取所述拼音测试业务名称的拼音关键字,具体包括:所述拼音关键字包括全拼拼音关键字和首字母拼音关键字;判断所述拼音测试业务名称的长度,当所述长度等于1时,剔除所述全拼拼音关键字;当所述长度等于2时,对所述拼音测试业务名称进行特殊符号拼接处理,得到所述全拼拼音关键字;当所述长度大于2时,将所述拼音测试业务名称作为所述全拼拼音关键字;提取所述拼音测试业务名称的首字母,得到组合字母,并判断所述组合字母的长度,当所述组合字母的长度等于1时,剔除所述首字母拼音关键字;当所述组合字母的长度等于2时,对所述组合字母进行特殊符号拼接处理,得到所述首字母拼音关键字;当所述组合...
【专利技术属性】
技术研发人员:林宇扬,梁峰,彭司宇,邢晓燕,罗宏贤,卢玉芳,
申请(专利权)人:宜通世纪科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。