一种日志文件的识别方法、装置和电子设备制造方法及图纸

技术编号:38750441 阅读:12 留言:0更新日期:2023-09-09 11:17
本发明专利技术实施例公开了一种日志文件的识别方法,应用于云平台中的电子设备中,包括:当接收到API调用请求时,获取API调用请求对应的待识别日志文件和和待识别日志文件对应的性能指标数据,对待识别日志文件进行解析,得到待识别日志文件的请求字段,将待识别日志文件的请求字段的特征和待识别日志文件对应的性能指标数据输入至训练好的随机森林模型中,输出得到待识别日志文件的识别结果。本发明专利技术实施例还同时公开了一种日志文件的识别装置和电子设备,提高了云平台中接口调用的异常识别方法的准确性,提高了云平台中接口调用的识别效率。率。率。

【技术实现步骤摘要】
一种日志文件的识别方法、装置和电子设备


[0001]本专利技术涉及云平台中接口异常调用的识别技术,尤其涉及一种日志文件的识别方法、装置和电子设备。

技术介绍

[0002]目前,随着云平台系统复杂度逐步提升,功能开发日益完善,云平台服务的安全性作为网络安全的一个分支变得越来越重要。在云平台中实现异常行为分析,即入侵检测,是一种新的网络安全机制,该机制用于检测及防止非法用户对云平台服务网络的未授权访问。
[0003]在相关技术中,针对云平台接口调用的识别方法大致分为两种,第一种是通过设置异常调用的发现规则的方式对云平台的性能指标进行识别,其中,基于业务逻辑来设置异常调用的发现规则,该方法中异常调用的发现规则是由认为设置,更新周期较长,但是异常调用一般来源多样可变,该方法的异常识别的准确性较低;第二种是基于业务逻辑对平台历史运行日志进行处理,将日志内容做聚类划分,并对聚类划分后的日志基于深度神经网络做建模处理,利用建立好的深度神经网络模型对日志文件进行是否为异常日志的识别,该方法中的深度神经网络本身复杂,准确性较低,导致识别准确性较低;由此可以看出,现有的云平台中接口调用的异常识别方法存在准确性较低的技术问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例期望提供一种日志文件的识别方法、装置和电子设备,以解决现有技术中云平台中接口调用的异常识别方法存在准确性较低的技术问题。
[0005]本专利技术的技术方案是这样实现的:
[0006]第一方面,本专利技术实施例提供了一种日志文件的识别方法,所述方法应用于云平台中的电子设备中,包括:
[0007]当接收到API调用请求时,获取所述API调用请求对应的待识别日志文件和所述待识别日志文件对应的性能指标数据;其中,所述待识别日志文件对应的性能指标数据为产生所述待识别日志文件时所述电子设备的性能指标数据;
[0008]对所述待识别日志文件进行解析,得到所述待识别日志文件的请求字段;
[0009]将所述待识别日志文件的请求字段的特征和所述待识别日志文件对应的性能指标数据输入至训练好的随机森林模型中,输出得到所述待识别日志文件的识别结果;其中,所述识别结果用于指示所述待识别日志文件是否出现异常。
[0010]第二方面,本专利技术实施例提供了一种日志文件的识别装置,所述装置设置于云平台的电子设备中,包括:
[0011]获取模块,用于当接收到API调用请求时,获取所述API调用请求对应的待识别日志文件和和所述待识别日志文件对应的性能指标数据;其中,所述待识别日志文件对应的性能指标数据为产生所述待识别日志文件时所述电子设备的性能指标数据;
[0012]解析模块,用于对所述待识别日志文件进行解析,得到所述待识别日志文件的请求字段;
[0013]识别模块,用于将所述待识别日志文件的请求字段的特征和所述待识别日志文件对应的性能指标数据输入至训练好的随机森林模型中,输出得到所述待识别日志文件的识别结果;其中,所述识别结果用于指示所述待识别日志文件是否出现异常。
[0014]第三方面,本专利技术实施例还提供了一种电子设备,所述云计算系统包括:处理器以及存储有所述处理器可执行指令的存储介质,所述存储介质通过通信总线依赖所述处理器执行操作,当所述指令被所述处理器执行时,执行上述一个或多个实施例所述日志文件的识别方法。
[0015]本专利技术实施例提供了一种计算机存储介质,存储有可执行指令,当所述可执行指令被一个或多个处理器执行的时候,所述处理器执行上述一个或多个实施例所述日志文件的识别方法。
[0016]本专利技术实施例所提供的一种日志文件的识别方法、装置和电子设备,该方法包括:当接收到API调用请求时,获取API调用请求组对应的待识别日志文件和待识别日志文件对应的性能指标数据,其中,待识别日志文件对应的性能指标数据为产生待识别日志文件时电子设备的性能指标数据,对待识别日志文件进行解析,得到待识别日志文件的请求字段,将待识别日志文件的请求字段的特征和待识别日志文件对应的性能指标数据输入至训练好的随机森林模型中,输出待识别日志文件的识别结果,其中,识别结果用于指示待识别日志文件是否出现异常;也就是说,在本专利技术实施例中,采用训练好的随机森林模型对输入的待识别日志文件的请求字段的特征和待识别日志文件对应的性能指标数据进行识别,得到待识别日志文件的识别结果,这里,利用训练好的随机森林模型进行识别,提高了识别的准确性,并且,在待识别日志文件的请求字段的特征的基础上结合待识别日志文件对应的性能指标数据,使得在识别中考虑到产生待识别日志文件时的电子设备的性能指标数据对识别结果的影响,有助于进一步提高识别结果的准确性。
附图说明
[0017]图1为本专利技术实施例中的一种可选的日志文件的识别方法的流程示意图;
[0018]图2为本专利技术实施例提供的一种可选的日志文件的识别方法的实例一的流程示意图;
[0019]图3为本专利技术实施例提供的一种可选的日志文件的识别方法的实例二的流程示意图;
[0020]图4为本专利技术实施例提供的一种可选的日志文件的识别方法的实例三的流程示意图;
[0021]图5为本专利技术实施例提供的一种可选的日志文件的识别方法的实例四的流程示意图;
[0022]图6为本专利技术实施例提供的一种可选的日志文件的识别方法的实例五的流程示意图;
[0023]图7为本专利技术实施例中的日志文件的识别装置的结构示意图;
[0024]图8为本专利技术实施例中的电子设备的结构示意图。
具体实施方式
[0025]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。
[0026]本专利技术实施例提供一种日志文件的识别方法,图1为本专利技术实施例中的一种可选的日志文件的识别方法的流程示意图,如图1所示,该日志文件的之别方法可以包括:
[0027]S101:当接收到API调用请求时,获取API调用请求对应的待识别日志文件和待识别日志文件对应的性能指标数据;
[0028]为了解决云平台中出现的队异常调用的识别准确率较低下的技术问题,本专利技术实施例提供一种日志文件的识别方法,该方法应用于云平台中的电子设备中,针对每一个目标用户设备或者云平台中的内部的其他电子设备向云平台中的电子设备发送应用程序接口(API,Application Program Interface)调用请求时,电子设备先获取API调用请求对应的日志文件,即为待识别日志文件,并获取待识别日志文件对应的性能指标数据。
[0029]其中,待识别日志文件对应的性能指标数据为产生待识别日志文件时电子设备的性能指标数据;也就是说,在对API调用请求是否出现异常进行判断时,主要是依据对待识别日志文件本身和待识别日志文件产生时电子设备的性能指标数据的识别来确定待识别日志文件是否存在异常,进而确定出API调用请求是否为异常调用请求,如此,通过对API调用请求的待识别日志文件相对应的数据的识别来实现API调用请求本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种日志文件的识别方法,其特征在于,所述方法应用于云平台中的电子设备中,包括:当接收到API调用请求时,获取所述API调用请求对应的待识别日志文件和所述待识别日志文件对应的性能指标数据;其中,所述待识别日志文件对应的性能指标数据为产生所述待识别日志文件时所述电子设备的性能指标数据;对所述待识别日志文件进行解析,得到所述待识别日志文件的请求字段;将所述待识别日志文件的请求字段的特征和所述待识别日志文件对应的性能指标数据输入至训练好的随机森林模型中,输出得到所述待识别日志文件的识别结果;其中,所述识别结果用于指示所述待识别日志文件是否出现异常。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:从获取到的样本数据集中获取训练数据集;其中,所述样本数据集为:针对至少两个API调用请求获取到的日志文件的数据集与所述获取到的日志文件的标签,所述数据集包括:所述获取到的日志文件的请求字段的特征和所述获取到的日志文件对应的性能指标数据,所述标签包括:指示所述获取到的日志文件对应的API调用请求为异常请求,指示所述获取到的日志文件对应的API调用请求为正常请求;将所述训练数据集分别输入至预设的随机森林模型中的每个分类树中进行训练,得到训练后的每个分类树;根据所述训练后的每个分类树,确定所述训练好的随机森林模型。3.根据权利要求2所述的方法,其特征在于,所述训练样本集的个数为K,且K的值为所述随机森林模型中包括的分类树的个数。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:针对至少两个API的调用请求采集日志文件,获取采集到的日志文件对应的性能指标数据,以及获取所述采集到的日志文件的标签;对所述采集到的日志文件进行解析,得到所述采集到的日志文件的请求字段;将所述采集到的日志文件的请求字段的特征和所述采集到的日志文件对应的性能指标数据,组成为所述采集到的日志文件的数据集;根据所述采集到的日志文件的数据集,确定所述样本数据集。5.根据权利要求4所述的方法,其特征在于,所述根据所述采集到的日志文件的数据集,确定所述样本数据集,包括:将所述采集到的日志文件的数据集和所述采集到的日志文件的标签输入至预设的机器学习算法中,得到所述采集到的日志文件的数据集中的第一指标数据;将满足第一预设条件的第一指标数据对应的采集到的日志文件的数据集和对应的采集到的日志文件的标签,确定为所述样本数据集。6.根据权利要求2所述的方法,其特征在于,所述根据所述训练后的分类树,确定所述训练好的随机森林模型,包括:从获取到的样本数据集中获取测试数据集;将所述测试数据集分别输入至所述训练后的每个分类树中,得到每个测试数据的至少两个测试输出结果;根据测试数据...

【专利技术属性】
技术研发人员:陈立峰何庆何榕健徐海勇陶涛杨猛尚晶陈卓阴梓然何建文
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1