漏洞信息确定方法、装置、计算机可读存储介质及设备制造方法及图纸

技术编号:24251790 阅读:21 留言:0更新日期:2020-05-22 23:42
本公开提供一种漏洞信息确定方法、漏洞信息确定装置、计算机可读存储介质及电子设备;涉及计算机技术领域。该漏洞信息确定方法包括:将获取到的文本信息切分为多个词组;计算每个词组的信息熵,并根据每个词组的信息熵确定文本信息的信息熵;若文本信息的信息熵满足预置条件,将文本信息确定为漏洞信息。本公开中的漏洞信息确定方法能够在一定程度上克服因处理包含较多冗余信息而造成资源浪费的问题,进而从抓取到的多数漏洞信息中及时获取有效漏洞信息,以减少资源浪费,提升资源利用率。

Vulnerability information determination method, device, computer readable storage medium and equipment

【技术实现步骤摘要】
漏洞信息确定方法、装置、计算机可读存储介质及设备
本公开涉及计算机
,具体而言,涉及一种漏洞信息确定方法、漏洞信息确定装置、计算机可读存储介质及电子设备。
技术介绍
随着互联网技术的发展,互联网安全问题已然成为最重要的问题之一。由于黑客的攻击手段趋于多样化,因此,如果能够及时感知漏洞则可以提升网络的安全性。传统的漏洞感知方式是从各大漏洞发布平台抓取漏洞信息,以通过抓取的漏洞信息确定出应对方法。但是,由于漏洞信息的数量较为庞大。因此,通过这种漏洞感知方式确定出的漏洞中冗余信息较多,进而会导致因处理包含较多冗余信息而造成资源浪费的问题。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种漏洞信息确定方法、漏洞信息确定装置、计算机可读存储介质及电子设备,可以在一定程度上克服因处理包含较多冗余信息而造成资源浪费的问题,进而从抓取到的多数漏洞信息中及时获取有效漏洞信息,以减少资源浪费,提升资源利用率。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的第一方面,提供一种漏洞信息确定方法,包括:将获取到的文本信息切分为多个词组;计算每个词组的信息熵,并根据每个词组的信息熵确定文本信息的信息熵;若文本信息的信息熵满足预置条件,将文本信息确定为漏洞信息。在本公开的一种示例性实施例中,计算每个词组的信息熵,包括:分别确定语料库中与每个词组匹配的预存词组;其中,预存词组与对应的词组中存在相同的词汇;根据预存词组的数量确定每个词组的信息熵。在本公开的一种示例性实施例中,根据预存词组的数量确定每个词组的信息熵,包括:确定每个词组对应的预存词组的数量在语料库的总词组数量中的占比;根据占比确定每个词组的信息熵。在本公开的一种示例性实施例中,将获取到的文本信息切分为多个词组之后,还包括:确定每个词组的凝聚度;过滤凝聚度低于预设凝聚度的词组。在本公开的一种示例性实施例中,将获取到的文本信息切分为多个词组之后,还包括:对多个词组进行格式处理,以使得多个词组的存储格式相同。在本公开的一种示例性实施例中,预置条件为文本信息的信息熵高于预设信息熵。在本公开的一种示例性实施例中,该漏洞信息确定方法还包括:根据漏洞信息更新漏洞数据库。根据本公开的第二方面,提供一种漏洞信息确定装置,包括词组切分单元、信息熵确定单元以及漏洞信息确定单元,其中:词组切分单元,用于将获取到的文本信息切分为多个词组;信息熵确定单元,用于计算每个词组的信息熵,并根据每个词组的信息熵确定文本信息的信息熵;漏洞信息确定单元,用于在文本信息的信息熵满足预置条件时,将文本信息确定为漏洞信息。在本公开的一种示例性实施例中,信息熵确定单元计算每个词组的信息熵的方式具体为:信息熵确定单元分别确定语料库中与每个词组匹配的预存词组;其中,预存词组与对应的词组中存在相同的词汇;信息熵确定单元根据预存词组的数量确定每个词组的信息熵。在本公开的一种示例性实施例中,信息熵确定单元根据预存词组的数量确定每个词组的信息熵的方式具体为:信息熵确定单元确定每个词组对应的预存词组的数量在语料库的总词组数量中的占比;信息熵确定单元根据占比确定每个词组的信息熵。在本公开的一种示例性实施例中,该漏洞信息确定装置还包括凝聚度确定单元和词组过滤单元,其中:凝聚度确定单元,用于在词组切分单元将获取到的文本信息切分为多个词组之后,确定每个词组的凝聚度;词组过滤单元,用于过滤凝聚度低于预设凝聚度的词组。在本公开的一种示例性实施例中,该漏洞信息确定装置还包括格式处理单元,其中:格式处理单元,用于在词组切分单元将获取到的文本信息切分为多个词组之后,对多个词组进行格式处理,以使得多个词组的存储格式相同。在本公开的一种示例性实施例中,预置条件为文本信息的信息熵高于预设信息熵。在本公开的一种示例性实施例中,该漏洞信息确定装置还包括漏洞更新单元,其中:漏洞更新单元,用于根据漏洞信息更新漏洞数据库。根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的方法。根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的方法。本公开示例性实施例可以具有以下部分或全部有益效果:在本公开的一示例实施方式所提供的漏洞信息确定方法中,将获取到的文本信息切分为多个词组,其中,文本信息可以为从平台抓取的漏洞信息;计算每个词组的信息熵,并根据每个词组的信息熵确定文本信息的信息熵,信息熵用于表征信息出现的频率,信息熵越高,该漏洞信息出现的频率越低;若文本信息的信息熵满足预置条件,将文本信息确定为漏洞信息,该漏洞信息不同于上述的从平台抓取的漏洞信息,该漏洞信息可以认为是从包含了冗余信息的众多漏洞信息中确定出的有效漏洞信息,其中,有效漏洞信息可以理解为新的漏洞信息,冗余信息可以理解为漏洞数据库中已存在的漏洞信息。依据上述方案描述,本公开一方面能够在一定程度上克服因处理包含较多冗余信息而造成资源浪费的问题,进而从抓取到的多数漏洞信息中及时获取有效漏洞信息,以减少资源浪费,提升资源利用率;另一方面能够根据信息熵确定出该文本信息为漏洞信息(即,有效漏洞信息,新的漏洞信息),提升漏洞感知的准确性和有效性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了可以应用本公开实施例的一种漏洞信息确定方法及漏洞信息确定装置的示例性系统架构的示意图;图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;图3示意性示出了根据本公开的一个实施例的漏洞信息确定方法的流程图;图4示意性示出了根据本公开的一个实施例的漏洞信息确定系统的架构图;图5示意性示出了根据本公开的另一个实施例的漏洞信息确定方法的流程图;图6示意性示出了根据本公开的一个实施例中的漏洞信息确定装置的结构框图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使本文档来自技高网...

【技术保护点】
1.一种漏洞信息确定方法,其特征在于,包括:/n将获取到的文本信息切分为多个词组;/n计算每个所述词组的信息熵,并根据每个所述词组的信息熵确定所述文本信息的信息熵;/n若所述文本信息的信息熵满足预置条件,将所述文本信息确定为漏洞信息。/n

【技术特征摘要】
1.一种漏洞信息确定方法,其特征在于,包括:
将获取到的文本信息切分为多个词组;
计算每个所述词组的信息熵,并根据每个所述词组的信息熵确定所述文本信息的信息熵;
若所述文本信息的信息熵满足预置条件,将所述文本信息确定为漏洞信息。


2.根据权利要求1所述的方法,其特征在于,计算每个所述词组的信息熵,包括:
分别确定语料库中与每个所述词组匹配的预存词组;其中,所述预存词组与对应的词组中存在相同的词汇;
根据所述预存词组的数量确定每个所述词组的信息熵。


3.根据权利要求2所述的方法,其特征在于,根据所述预存词组的数量确定每个所述词组的信息熵,包括:
确定每个所述词组对应的预存词组的数量在所述语料库的总词组数量中的占比;
根据所述占比确定每个所述词组的信息熵。


4.根据权利要求1所述的方法,其特征在于,将获取到的文本信息切分为多个词组之后,还包括:
确定每个所述词组的凝聚度;
过滤凝聚度低于预设凝聚度的词组。


5.根据权利要求1所述的方法,其特征在于,将获取到的文本信息切分为...

【专利技术属性】
技术研发人员:曾智洋郑增亮董志成马超杨勇胡珀罗喜军
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1