业务识别方法、装置、电子设备和存储介质制造方法及图纸

技术编号:39132953 阅读:5 留言:0更新日期:2023-10-23 14:51
本实施例公开了一种业务识别方法、装置、电子设备和计算机存储介质,该方法包括:获取网络数据的原始码流;通过对所述原始码流进行分析,确定所述原始码流的业务特征数据;确定所述业务特征数据的类型;根据所述业务特征数据的类型,确定对所述原始码流进行业务识别的第一识别方法;采用所述第一识别方法对所述业务特征数据进行处理,得出所述原始码流的业务识别结果。识别结果。识别结果。

【技术实现步骤摘要】
业务识别方法、装置、电子设备和存储介质


[0001]本申请属于人工智能(Artificial Intelligence,AI)
,特别涉及一种业务识别方法、装置、电子设备和计算机存储介质。

技术介绍

[0002]在相关技术中,一种普遍的网络流量业务识别方案为:通过人工规则校验的方式进行网络流量的业务识别,即,基于经验设定判定条件,从而判定网络流量的业务类型;这种通过人工规则校验的方式进行网络流量的业务识别的方案存在识别准确性较低的问题;另外,也可以利用简易轻量化的算法模型对数据业务进行简单归类和识别,然而,相关技术中仅仅采用单一的模型对数据业务进行业务识别,不适用于对不同类型的数据业务进行业务识别,在需要对新数据业务进行扩展的场景中,需要针对模型进行大规模替换,扩展性较低。

技术实现思路

[0003]本申请实施例提供一种业务识别方法、装置、电子设备和计算机存储介质。
[0004]本申请实施例提供了一种业务识别方法,所述方法包括:
[0005]获取网络数据的原始码流;
[0006]通过对所述原始码流进行分析,确定所述原始码流的业务特征数据;确定所述业务特征数据的类型;
[0007]根据所述业务特征数据的类型,确定对所述原始码流进行业务识别的第一识别方法;
[0008]采用所述第一识别方法对所述业务特征数据进行处理,得出所述原始码流的业务识别结果。
[0009]在一些实施例中,所述通过对所述原始码流进行分析,确定所述原始码流的业务特征数据,包括:确定所述原始码流的协议类型;根据所述原始码流的协议类型,确定所述原始码流的业务特征数据。
[0010]可以看出,本申请实施例可以根据原始码流的协议类型,较为准确地确定出原始码流的业务特征数据,从而有利于根据原始码流的业务特征数据的类型,较为准确地确定对原始码流进行业务识别的第一识别方法,有利于提高对原始码流进行业务识别的准确性。
[0011]在一些实施例中,所述根据所述原始码流的协议类型,确定所述原始码流的业务特征数据,包括:在所述原始码流的协议类型为超文本传输协议(Hyper Text Transfer Protocol,HTTP)的情况下,将原始码流的码流信息和关键明文字段确定为所述原始码流的业务特征数据,所述关键明文字段为使用明文表征所述原始码流的业务类型的字段;在所述原始码流的协议类型为HTTPS协议或新增的可支持协议的情况下,至少将原始码流的关键明文字段确定为所述原始码流的业务特征数据;在所述原始码流的协议类型为其它协议
的情况下,将原始码流的目标字段确定为所述原始码流的业务特征数据,所述其它协议表示除所述HTTP、HTTPS和所述新增的可支持协议之外的网络通信协议,所述目标字段为预先规定的字段。
[0012]可以看出,本申请实施例可以根据原始码流的协议类型,较为准确地确定原始码流中的业务特征数据,有利于较为准确地确定对原始码流进行业务识别的第一识别方法,从而可以提高对原始码流进行业务识别的准确性。
[0013]在一些实施例中,所述根据所述原始码流的协议类型,确定所述原始码流的业务特征数据,还包括:在所述原始码流的协议类型为HTTPS协议的情况下,将原始码流中无法获取明文信息的内容确定为所述原始码流的业务特征数据。
[0014]可以看出,对于HTTPS协议,由于还可以将原始码流中无法获取明文信息的内容确定为原始码流的业务特征数据,因此,有利于更加准确定对原始码流进行业务识别的方法,从而可以提高对原始码流进行业务识别的准确性。
[0015]在一些实施例中,所述根据所述业务特征数据的类型,确定对所述原始码流进行业务识别的第一识别方法,包括:在所述业务特征数据为关键明文字段的情况下,确定所述第一识别方法包括使用自然语言处理(Natural Language Processing,NLP)模型进行业务识别的方法;所述关键明文字段为使用明文表征所述原始码流的业务类型的字段;在所述业务特征数据为所述原始码流的码流信息的情况下,确定所述第一识别方法包括使用卷积神经网络(Convolutional Neural Networks,CNN)模型进行业务识别的方法;或者,在所述原始码流的协议类型为HTTPS协议,且所述述业务特征数据为所述原始码流中无法获取明文信息的内容的情况下,确定所述第一识别方法包括使用CNN模型进行业务识别的方法;在所述业务特征数据为目标字段的情况下,判断所述目标字段是否包含所述关键明文字段,得出判断结果;根据所述判断结果确定所述第一识别方法;所述目标字段为预先规定的字段。
[0016]可以看出,本申请实施例可以根据业务特征数据的类型,较为准确地确定对原始码流进行业务识别的第一识别方法,从而,有利于提高对原始码流进行业务识别的准确性。
[0017]在一些实施例中,所述根据所述判断结果确定所述第一识别方法,包括:所述判断结果为所述目标字段包含所述关键明文字段的情况下,确定所述第一识别方法包括使用NLP模型进行业务识别的方法;在所述判断结果为所述目标字段不包含所述关键明文字段的情况下,确定所述第一识别方法包括使用预先制定的人工规则进行业务识别的方法。
[0018]可以看出,本申请实施例可以根据目标字段中的内容,灵活地确定对原始码流进行业务识别的方法,有利于对不同类型的数据业务进行业务识别。
[0019]在一些实施例中,所述采用所述第一识别方法对所述业务特征数据进行处理,得出所述原始码流的业务识别结果,包括:在所述第一识别方法包括使用所述NLP模型进行业务识别的方法,或者,所述第一识别方法包括使用所述CNN模型进行业务识别的方法的情况下,采用所述第一识别方法对所述业务特征数据进行处理,得出所述原始码流的初步业务识别结果和模型预测概率,所述模型预测概率表示使用所述NLP模型或所述CNN模型得出所述初步业务识别结果的准确度;在所述模型预测概率大于或等于概率阈值的情况下,将所述原始码流的初步业务识别结果作为所述业务识别结果;在所述模型预测概率小于概率阈值的情况下,将所述第一识别方法重新确定为使用预先制定的人工规则进行业务识别的方
法,采用重新确定的所述第一识别方法对所述业务特征数据进行处理,得出所述原始码流的业务识别结果。
[0020]可以看出,本申请实施例中可以在模型预测概率大于或等于概率阈值的情况下,保留使用NLP模型或CNN模型得出的初步业务识别结果;在模型预测概率小于概率阈值的情况下,说明初步业务识别结果的准确度较低,因此,改为使用人工规则进行业务识别,从而,有利于提升业务识别的准确性。
[0021]本申请实施例还提供了一种业务识别装置,所述装置包括:
[0022]获取模块,用于获取网络数据的原始码流;
[0023]第一处理模块,用于通过对所述原始码流进行分析,确定所述原始码流的业务特征数据;确定所述业务特征数据的类型;
[0024]第二处理模块,用于根据所述业务特征数据的类型,确定对所述原始码流进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种业务识别方法,其特征在于,所述方法包括:获取网络数据的原始码流;通过对所述原始码流进行分析,确定所述原始码流的业务特征数据;确定所述业务特征数据的类型;根据所述业务特征数据的类型,确定对所述原始码流进行业务识别的第一识别方法;采用所述第一识别方法对所述业务特征数据进行处理,得出所述原始码流的业务识别结果。2.根据权利要求1所述的方法,其特征在于,所述通过对所述原始码流进行分析,确定所述原始码流的业务特征数据,包括:确定所述原始码流的协议类型;根据所述原始码流的协议类型,确定所述原始码流的业务特征数据。3.根据权利要求2所述的方法,其特征在于,所述根据所述原始码流的协议类型,确定所述原始码流的业务特征数据,包括:在所述原始码流的协议类型为超文本传输协议HTTP的情况下,将原始码流的码流信息和关键明文字段确定为所述原始码流的业务特征数据,所述关键明文字段为使用明文表征所述原始码流的业务类型的字段;在所述原始码流的协议类型为HTTPS协议或新增的可支持协议的情况下,至少将原始码流的关键明文字段确定为所述原始码流的业务特征数据;在所述原始码流的协议类型为其它协议的情况下,将原始码流的目标字段确定为所述原始码流的业务特征数据,所述其它协议表示除所述HTTP、HTTPS和所述新增的可支持协议之外的网络通信协议,所述目标字段为预先规定的字段。4.根据权利要求3所述的方法,其特征在于,所述根据所述原始码流的协议类型,确定所述原始码流的业务特征数据,还包括:在所述原始码流的协议类型为HTTPS协议的情况下,将原始码流中无法获取明文信息的内容确定为所述原始码流的业务特征数据。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述业务特征数据的类型,确定对所述原始码流进行业务识别的第一识别方法,包括:在所述业务特征数据为关键明文字段的情况下,确定所述第一识别方法包括使用自然语言处理NLP模型进行业务识别的方法;所述关键明文字段为使用明文表征所述原始码流的业务类型的字段;在所述业务特征数据为所述原始码流的码流信息的情况下,确定所述第一识别方法包括使用卷积神经网络CNN模型进行业务识别的方法;或者,在所述原始码流的协议类型为HTTPS协议,且所述述业务特征数据为所述原始码流中无法获取明文信息的内容的情况下,确定所述第一识别方法包括使用CNN模型进行...

【专利技术属性】
技术研发人员:赵雷黄丽思赵延梁燕萍余立
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1