恶意程序检测模型的更新方法、装置、设备及介质制造方法及图纸

技术编号：35143727 阅读：13 留言：0更新日期：2022-10-05 10:20

本公开涉及恶意程序检测模型的更新方法、装置、设备及介质，该方法包括：通过恶意程序检测模型检测目标程序样本为恶意程序的概率值；在概率值低于预设概率阈值的情况下，将目标程序样本对应的API序列添加至训练集；训练集中的API序列样本包括目标程序样本和预先存在的多组恶意程序样本各自对应的API序列；使用密度聚类算法对训练集中的API序列样本进行聚类，并对每一类进行样本抽取，得到验证集；基于训练集和验证集对恶意程序检测模型进行训练更新。本公开能够在保证模型性能的同时节省人力消耗、空间消耗。空间消耗。空间消耗。

全部详细技术资料下载

【技术实现步骤摘要】
恶意程序检测模型的更新方法、装置、设备及介质

[0001]本公开涉及计算机
，尤其涉及恶意程序检测模型的更新方法、装置、设备及介质。

技术介绍

[0002]随着互联网的急速发展，恶意程序也在不断地发展。动态检测是针对恶意程序的一种主要检测方法，是基于恶意程序运行过程中的行为进行研究，通过对已知的恶意程序行为进行学习，找出规律，从而可以识别新的恶意程序。通过机器学习方法进行学习检测是恶意程序检测的重要方式，随着恶意程序的不断更新，模型对于恶意程序的检测性能会下降，老旧的模型满足不了新的检测需求，如果想要模型适应新的恶意程序，则需要使用包括新样本和老样本在内的全部数据集，从头训练一个新的模型版本。使用全部的数据重新训练会消耗大量的时间和计算资源，如果数据量巨大，甚至无法使用批量学习算法。

技术实现思路

[0003]为了解决上述技术问题，本公开提供了一种恶意程序检测模型的更新方法、装置、设备及介质。
[0004]本公开提供了一种恶意程序检测模型的更新方法，包括：
[0005]通过恶意程序检测模型检测目标程序样本为恶意程序的概率值；
[0006]在所述概率值低于预设概率阈值的情况下，将所述目标程序样本对应的API序列添加至训练集；所述训练集中的API序列样本包括所述目标程序样本和预先存在的多组恶意程序样本各自对应的API序列；
[0007]使用密度聚类算法对所述训练集中的API序列样本进行聚类，并对每一类进行样本抽取，得到验证集；
[0008]基于所述训练集和所述...

【技术保护点】

【技术特征摘要】
1.一种恶意程序检测模型的更新方法，其特征在于，包括：通过恶意程序检测模型检测目标程序样本为恶意程序的概率值；在所述概率值低于预设概率阈值的情况下，将所述目标程序样本对应的API序列添加至训练集；所述训练集中的API序列样本包括所述目标程序样本和预先存在的多组恶意程序样本各自对应的API序列；使用密度聚类算法对所述训练集中的API序列样本进行聚类，并对每一类进行样本抽取，得到验证集；基于所述训练集和所述验证集对所述恶意程序检测模型进行训练更新。2.根据权利要求1所述的方法，其特征在于，所述通过恶意程序检测模型检测目标程序样本为恶意程序的概率值，包括：提取目标程序样本在运行过程中的动态行为API序列；对所述动态行为API序列进行MD5编码和向量化处理，得到目标样本向量；将所述目标样本向量输入至恶意程序检测模型进行检测，得到所述目标程序样本为恶意程序的概率值。3.根据权利要求2所述的方法，其特征在于，所述提取目标程序样本在运行过程中的动态行为API序列，包括：在预设的虚拟操作系统环境中运行目标程序样本；提取所述目标程序样本在运行过程中产生的动态行为日志；从所述动态行为日志中提取动态行为API序列。4.根据权利要求3所述的方法，其特征在于，所述从所述动态行为日志中提取动态行为API序列，包括：从所述动态行为日志中提取初始API序列；对所述初始API序列进行剪枝和去重操作，得到最终的动态行为API序列。5.根据权利要求1所述的方法，其特征在于，当初次模型训练时，所述基于所述训练集和所述验证集对所述恶意程序检测模型进行训练更新，包括：根据预先训练好的初始API词库对所述训练集中的API序列样本进行向量化，得到第一训练样本向量；根据所述初始API词库对所述验证集中的API序列样本进行向量化，得到第一验证样本向量；基于所述第一训练样本向量和所述第一验证样本向量对预设的文本卷积神经网络进行训练；将训练好的文本卷积神经网络作为所述恶意程序检测模型。6.根据权利要求1所述的方法，其特征在于，当非初次模型训练时，所述基于所述训练集和所述验证集对所述恶意程序检测模型进行训练更新，包括：分别基于所述训练集和所述验证集得到对应的第二训练样本向量和第二验证样本...

【专利技术属性】
技术研发人员：苏香艳，
申请(专利权)人：北京天融信科技有限公司北京天融信软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人