检测方法、装置及计算机可读存储介质制造方法及图纸

技术编号:32458818 阅读:51 留言:0更新日期:2022-02-26 08:43
本公开提供了一种检测方法、装置及计算机可读存储介质,涉及网络安全技术领域,所述方法包括:对网络访问请求进行分词,以得到所述网络访问请求的词序列;利用滑动窗口对所述词序列进行截取,以得到多个第一待测序列,至少两个相邻的第一待测序列部分交叠,每个第一待测序列的长度、所述滑动窗口的长度与机器学习检测模型的输入的长度一致;将待测序列输入所述机器学习检测模型,以检测所述网络访问请求是否为恶意请求,所述待测序列包括所述多个第一待测序列。一待测序列。一待测序列。

【技术实现步骤摘要】
检测方法、装置及计算机可读存储介质


[0001]本公开涉及网络安全
,尤其是一种检测方法、装置及计算机可读存储介质。

技术介绍

[0002]随着互联网技术的发展,越来越多的用户通过发起网络访问请求以访问互联网中的服务器或其他终端,然而有些非法用户会在网络访问请求中嵌入一段恶意文本,以进行攻击性访问,这种攻击性访问将造成被访问的服务器或其他终端的数据丢失等安全性等问题。
[0003]相关技术中,网络访问请求的形式一般是文本形式,故,可以将网络访问请求输入能够进行自然语言处理的机器学习检测模型中,以检测该网络访问请求是否为恶意请求。

技术实现思路

[0004]专利技术人注意到,相关技术中的方式下,由于机器学习检测模型的输入的长度通常有限制,故,在网络访问请求的词序列超过该输入的长度的情况下,将对超过该输入的长度的部分进行截断处理,如此,破环了词序列的连续性,可能导致断口处的特征丢失,从而导致检测的准确度较低。
[0005]为了解决上述问题,本公开实施例提出了如下解决方案。
[0006]根据本公开实施例的一方面,提供一种检测方法,包括:对网络访问请求进行分词,以得到所述网络访问请求的词序列;利用滑动窗口对所述词序列进行截取,以得到多个第一待测序列,至少两个相邻的第一待测序列部分交叠,每个第一待测序列的长度、所述滑动窗口的长度与机器学习检测模型的输入的长度一致;将待测序列输入所述机器学习检测模型,以检测所述网络访问请求是否为恶意请求,所述待测序列包括所述多个第一待测序列。
>[0007]在一些实施例中,所述多个第一待测序列的数量为M,第i个第一待测序列与第i+1个第一待测序列部分交叠,1≤i≤M

1,M为大于或等于2的正整数。
[0008]在一些实施例中,所述多个第一待测序列包括多组第一待测序列,每组第一待测序列包括两个相邻且部分交叠的第一待测序列,任意两组第一待测序列中两个相邻的第一待测序列部分交叠的长度相同。
[0009]在一些实施例中,所述部分交叠的长度大于或等于所述滑动窗口的长度的二分之一。
[0010]在一些实施例中,所述截取还得到第二待测序列,所述第二待测序列的长度小于所述滑动窗口的长度,所述方法还包括:对所述第二待测序列进行处理,以得到第三待测序列,所述第三待测序列的长度与所述滑动窗口的长度一致;其中,所述待测序列还包括所述第三待测序列。
[0011]在一些实施例中,对所述第二待测序列进行处理,以得到第三待测序列包括:将所
述第二待测序列与填充值序列拼接,以得到第三待测序列,所述填充值序列中的至少一个填充值为0。
[0012]在一些实施例中,所述填充值序列中的每个填充值均为0。
[0013]在一些实施例中,所述词序列的第一个词位于所述多个第一待测序列中,所述词序列的最后一个词位于所述第二待测序列中。
[0014]在一些实施例中,所述机器学习检测模型为基于有监督学习的文本分析模型。
[0015]在一些实施例中,所述网络访问请求为基于超文本传输协议的请求。
[0016]根据本公开实施例的另一方面,提供一种检测装置,包括:分词模块,被配置为对网络访问请求进行分词,以得到所述网络访问请求的词序列;截取模块,被配置为利用滑动窗口对所述词序列进行截取,以得到多个第一待测序列,至少两个相邻的第一待测序列部分交叠,每个第一待测序列的长度、所述滑动窗口的长度与机器学习检测模型的输入的长度一致;输入模块,被配置为将待测序列输入所述机器学习检测模型,以检测所述网络访问请求是否为恶意请求,所述待测序列包括所述多个第一待测序列。
[0017]根据本公开实施例的又一方面,提供一种检测装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行上述任意一个实施例所述的方法。
[0018]根据本公开实施例的再一方面,提供一种计算机可读存储介质,包括计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述任意一个实施例所述的方法。
[0019]根据本公开实施例的还一方面,提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现上述任意一个实施例所述的方法。
[0020]本公开实施例中,通过滑动窗口对网络访问请求的词序列进行截取,可以使多个第一待测序列中至少两个相邻的第一待测序列部分交叠,每个第一待测序列的长度、滑动窗口的长度和机器学习检测模型的输入的长度一致,以便将多个第一待测序列输入机器学习检测模型以检测该网络请求是否为恶意请求。如此,减少了断口处的特征丢失的可能性,从而提高了检测的准确度。
[0021]下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
[0022]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是根据本公开一些实施例的检测方法的流程示意图;
[0024]图2是根据本公开一些实施例的检测装置的结构示意图;
[0025]图3是根据本公开另一些实施例的检测装置的结构示意图。
具体实施方式
[0026]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于
本公开中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0027]除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0028]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0029]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
[0030]在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
[0031]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0032]图1是根据本公开一些实施例的检测方法的流程示意图。
[0033]在步骤102,对网络访问请求进行分词,以得到网络访问请求的词序列。
[0034]在一些实施例中,网络访问请求可以为基于超文本传输协议(Hyper Text Transfer Protocol,HTTP)的请求。
[0035]在一些实施例中,可以采用基于词典匹配的分词算法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种检测方法,包括:对网络访问请求进行分词,以得到所述网络访问请求的词序列;利用滑动窗口对所述词序列进行截取,以得到多个第一待测序列,至少两个相邻的第一待测序列部分交叠,每个第一待测序列的长度、所述滑动窗口的长度与机器学习检测模型的输入的长度一致;将待测序列输入所述机器学习检测模型,以检测所述网络访问请求是否为恶意请求,所述待测序列包括所述多个第一待测序列。2.根据权利要求1所述的方法,其中,所述多个第一待测序列的数量为M,第i个第一待测序列与第i+1个第一待测序列部分交叠,1≤i≤M

1,M为大于或等于2的正整数。3.根据权利要求2所述的方法,其中,所述多个第一待测序列包括多组第一待测序列,每组第一待测序列包括两个相邻且部分交叠的第一待测序列,任意两组第一待测序列中两个相邻的第一待测序列部分交叠的长度相同。4.根据权利要求1所述的方法,其中,所述部分交叠的长度大于或等于所述滑动窗口的长度的二分之一。5.根据权利要求1所述的方法,其中,所述截取还得到第二待测序列,所述第二待测序列的长度小于所述滑动窗口的长度,所述方法还包括:对所述第二待测序列进行处理,以得到第三待测序列,所述第三待测序列的长度与所述滑动窗口的长度一致;其中,所述待测序列还包括所述第三待测序列。6.根据权利要求5所述的方法,其中,对所述第二待测序列进行处理,以得到第三待测序列包括:将所述第二待测序列与填充值序列拼接,以得到第三待测序列,所述填充值序列中的至少一个填充值为0。7.根据权利要求6所述的方法,其中,所述...

【专利技术属性】
技术研发人员:施丽佳游丽娜吴淑川秦金晓
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1