一种异常软件检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39280753 阅读:8 留言:0更新日期:2023-11-07 10:55
本申请涉及信息安全技术领域,尤其涉及一种异常软件检测方法、装置、电子设备及存储介质,用以提高异常软件检测的准确度和检测效率,其中,方法包括:获取待检测软件的待处理信息,将待处理信息转换成二进制数据流,并将二进制数据流映射为待检测图片;基于预设的多个特征尺度,分别对待检测图片进行特征提取,获得相应的中间特征图;分别对获得的各中间特征图进行融合处理,得到待检测图片的目标特征图,并基于目标特征图,获得待检测软件的异常检测结果。这样在对待检测软件进行异常检测时,将待检测软件转化为待检测图片,分析待检测图片的特征,确定异常检测结果,能够提高异常软件检测的准确度和检测效率。常软件检测的准确度和检测效率。常软件检测的准确度和检测效率。

【技术实现步骤摘要】
一种异常软件检测方法、装置、电子设备及存储介质


[0001]本申请涉及信息安全
,尤其涉及一种异常软件检测方法、装置、电子设备及存储介质。

技术介绍

[0002]随着移动互联网的不断发展,智能终端被广泛应用于人们的日常生活。安卓(Android)作为使用最广泛的移动操作系统,各种Android软件(例如,移动支付、智能办公等)随之增长。而在这些Android软件中,存在威胁隐私甚至财产安全的异常软件,异常软件的数量越来越多,造成的危害也越来越大。
[0003]现有技术中,对异常软件进行检测时,通常会预先设置软件黑名单,并将待检测软件的特征与软件黑名单进行对比,若待检测软件与软件黑名单匹配,则待检测软件为异常软件。
[0004]然而,由于预设的软件黑名单无法包含所有的异常软件的特征,因此,会出现漏检的问题,例如,当异常软件第一次被检测时,由于异常软件的特征未包含在预设的软件黑名单中,因此,无法筛选出异常软件。另外,需要将待检测软件的特征与软件黑名单包含的各异常软件逐个进行对比,对比效率较低,导致无法及时检测到异常软件,造成信息泄露的情况。
[0005]因此,如何提高异常软件检测的准确度和检测效率,是目前需要解决的技术问题。

技术实现思路

[0006]本申请实施例提供一种异常软件检测方法、装置、电子设备及存储介质,以提高异常软件检测的准确度和检测效率。
[0007]本申请实施例提供的具体技术方案如下:
[0008]第一方面,提供一种异常软件检测方法,包括:r/>[0009]获取待检测软件的待处理信息,将待处理信息转换成二进制数据流,并将二进制数据流映射为待检测图片,其中,待处理信息包括:静态信息和动态信息,静态信息包含:待检测软件的程序代码,动态信息包含:待检测软件运行过程中的运行数据;
[0010]基于预设的多个特征尺度,分别对待检测图片进行特征提取,获得相应的中间特征图;
[0011]分别对获得的各中间特征图进行融合处理,得到待检测图片的目标特征图,并基于目标特征图,获得待检测软件的异常检测结果。
[0012]第二方面,提供一种异常软件检测装置,包括:
[0013]获取模块,用于获取待检测软件的待处理信息,将待处理信息转换成二进制数据流,并将二进制数据流映射为待检测图片,其中,待处理信息包括:静态信息和动态信息,静态信息包含:待检测软件的程序代码,动态信息包含:待检测软件运行过程中的运行数据;
[0014]提取模块,用于基于预设的多个特征尺度,分别对待检测图片进行特征提取,获得
相应的中间特征图;
[0015]第一处理模块,用于分别对获得的各中间特征图进行融合处理,得到待检测图片的目标特征图,并基于目标特征图,获得待检测软件的异常检测结果。
[0016]可选的,获取待检测软件的待处理信息,将待处理信息转换成二进制数据流,并将二进制数据流映射为待检测图片时,获取模块还用于:
[0017]获取待检测软件的待处理文件集,对待处理文件集进行反汇编处理,获得待检测软件的二进制文件集,其中,待处理文件集包含:待检测软件运行过程中使用的各静态文件和各动态文件;
[0018]读取二进制文件集中包含的二进制数据,生成二进制数据流;
[0019]按照预设的比特数,对二进制数据流进行分组,得到各二进制数据组,并分别将各二进制数据组,映射为相应的像素点,获得待检测图片,其中,每个二进制数据组包含:符合比特数的二进制数据。
[0020]可选的,将二进制数据流映射为待检测图片之后,装置还包括调整模块,调整模块用于:
[0021]若待检测图片的图片尺寸小于预设的标准图片尺寸,则对待检测图片进行边缘补零,将待检测图片的图片尺寸放大为标准图片尺寸,获得更新后的待检测图片;
[0022]若待检测图片的图片尺寸于标准图像尺寸,则对待检测图片进行像素重构,将待检测图片的图片尺寸缩小为标准图像尺寸,获得更新后的待检测图片。
[0023]可选的,异常检测结果是通过将待检测图片,输入目标检测模型获得的,装置还包括训练模块,训练模块用于:
[0024]基于样本图片集,对预训练的图片分类模型进行迭代训练,获得目标检测模型,样本图片集中每样本图片至少包括:相应样本软件的样本静态信息和样本动态信息,样本静态信息包含:相应样本软件的程序代码,样本动态信息包含:相应样本软件运行过程中的运行数据,图片分类模型是基于包含预设图片数量的图片数据集进行训练获得的,其中,每个迭代过程执行以下操作:
[0025]基于预设的多个样本特征尺度,分别对选取的样本图片进行特征提取,获得相应的中间样本特征图;
[0026]分别对获得的各中间样本特征图进行融合处理,得到待检测图片的目标样本特征图,并基于目标样本特征图,获得样本图片的异常预测结果;
[0027]基于异常预测结果对应的损失值进行调参。
[0028]可选的,基于目标特征图,获得待检测软件的异常检测结果之后,装置还包括第二处理模块,第二处理模块用于:
[0029]若待检测软件的异常检测结果为异常软件,则去除待检测软件的静态信息中的噪声信息,得到待检测文本;
[0030]提取待检测文本中的各关键词,并计算各关键词的权重值,获得待检测文本的主题分布;
[0031]从预设的各异常类簇中,确定出待检测软件所属的目标异常类簇,其中,目标异常类簇与待检测文本之间的主题分布相似度符合预设的主题相似条件。
[0032]可选的,若待检测软件的异常检测结果为异常软件,则将待检测软件的待处理信
息进行预处理,得到待检测文本之前,装置还包括聚类模块,聚类模块用于:
[0033]采集异常软件数据集,去除异常软件数据集中的噪声信息,得到各文本数据,异常软件数据集中每个样本异常软件至少包括:相应样本异常软件的样本静态信息;
[0034]针对各文本数据,分别执行以下操作:提取一个文本数据中的各样本关键词,并计算各样本关键词的样本权重值,获得一个文本数据的样本主题分布;按照获得的各样本主题分布之间的相似性,对各样本异常软件进行聚类,获得各异常类簇。
[0035]第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面任一项所述方法的步骤。
[0036]第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一项所述方法的步骤。
[0037]第五方面,提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行上述第一方面任一项所述方法的步骤。
[0038]本申请实施例中,首先获取待检测软件的待处理信息,将待处理信息转换成二本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种异常软件检测方法,其特征在于,包括:获取待检测软件的待处理信息,将所述待处理信息转换成二进制数据流,并将所述二进制数据流映射为待检测图片,其中,所述待处理信息包括:静态信息和动态信息,所述静态信息包含:所述待检测软件的程序代码,所述动态信息包含:所述待检测软件运行过程中的运行数据;基于预设的多个特征尺度,分别对所述待检测图片进行特征提取,获得相应的中间特征图;分别对获得的各中间特征图进行融合处理,得到所述待检测图片的目标特征图,并基于所述目标特征图,获得所述待检测软件的异常检测结果。2.如权利要求1所述的方法,其特征在于,所述获取待检测软件的待处理信息,将所述待处理信息转换成二进制数据流,并将所述二进制数据流映射为待检测图片,包括:获取待检测软件的待处理文件集,对所述待处理文件集进行反汇编处理,获得所述待检测软件的二进制文件集,其中,所述待处理文件集包含:所述待检测软件运行过程中使用的各静态文件和各动态文件;读取所述二进制文件集中包含的二进制数据,生成二进制数据流;按照预设的比特数,对所述二进制数据流进行分组,得到各二进制数据组,并分别将所述各二进制数据组,映射为相应的像素点,获得待检测图片,其中,每个二进制数据组包含:符合所述比特数的二进制数据。3.如权利要求1所述的方法,其特征在于,所述将所述二进制数据流映射为待检测图片之后,还包括:若所述待检测图片的图片尺寸小于预设的标准图片尺寸,则对所述待检测图片进行边缘补零,将所述待检测图片的图片尺寸放大为所述标准图片尺寸,获得更新后的所述待检测图片;若所述待检测图片的图片尺寸于所述标准图像尺寸,则对所述待检测图片进行像素重构,将所述待检测图片的图片尺寸缩小为所述标准图像尺寸,获得更新后的所述待检测图片。4.如权利要求1所述的方法,其特征在于,所述异常检测结果是通过将所述待检测图片,输入目标检测模型获得的,其中,所述目标检测模型是采用以下方式训练获得的:基于样本图片集,对预训练的图片分类模型进行迭代训练,获得目标检测模型,所述样本图片集中每样本图片至少包括:相应样本软件的样本静态信息和样本动态信息,所述样本静态信息包含:所述相应样本软件的程序代码,所述样本动态信息包含:所述相应样本软件运行过程中的运行数据,所述图片分类模型是基于包含预设图片数量的图片数据集进行训练获得的,其中,每个迭代过程执行以下操作:基于预设的多个样本特征尺度,分别对选取的样本图片进行特征提取,获得相应的中间样本特征图;分别对获得的各中间样本特征图进行融合处理,得到所述待检测图片的目标样本特征图,并基于所述目标样本特征图,获得所述样本图片的异常预...

【专利技术属性】
技术研发人员:高思雨呼博文徐浩
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1