一种可执行文件检测方法、装置、设备及存储介质制造方法及图纸

技术编号:37986842 阅读:21 留言:0更新日期:2023-06-30 10:01
本申请公开了一种可执行文件检测方法、装置、设备及存储介质,涉及文本识别技术领域,包括:对待检测可执行文件进行文字提取并进行预处理以得到预处理文本;利用预设恶意文本知识图谱集对所述预处理文本进行向量化以得到向量化集合;利用预设相似度计算方法计算所述向量化集合和预设恶意文本知识图谱集之间的相似度以得到相似度值;判断所述相似度值是否大于预设相似度阈值,若所述相似度值大于预设相似度阈值则判定所述待检测可执行文件为恶意可执行文件。可见,本申请通过借助一个恶意文本特征值知识图谱辅助处理输入的经过预处理的待检测可执行文件,最终得到待检测可执行文件的判定结果。这样一来,对待检测可执行文件的检测过程稳定性好。的检测过程稳定性好。的检测过程稳定性好。

【技术实现步骤摘要】
一种可执行文件检测方法、装置、设备及存储介质


[0001]本专利技术涉及文本识别
,特别涉及一种可执行文件检测方法、装置、设备及存储介质。

技术介绍

[0002]在样本分析和威胁狩猎中,经常会发现现有的静态字符串特征标记和处理方式过于容易被攻击者通过轻微修改文本绕过,这一情况会使病毒分析人员落于攻击者身后,并且使得字符串特征的有效时间极大降低。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种可执行文件检测方法、装置、设备及存储介质,能够灵活检测样本中字符串的恶意情况。其具体方案如下:
[0004]第一方面,本申请公开了一种可执行文件检测方法,包括:
[0005]对待检测可执行文件进行文字提取并进行预处理以得到预处理文本;
[0006]利用预设恶意文本知识图谱集对所述预处理文本进行向量化以得到向量化集合;
[0007]利用预设相似度计算方法计算所述向量化集合和所述预设恶意文本知识图谱集之间的相似度以得到相似度值;
[0008]判断所述相似度值是否大于预设相似度阈值,若本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种可执行文件检测方法,其特征在于,包括:对待检测可执行文件进行文字提取并进行预处理以得到预处理文本;利用预设恶意文本知识图谱集对所述预处理文本进行向量化以得到向量化集合;利用预设相似度计算方法计算所述向量化集合和所述预设恶意文本知识图谱集之间的相似度以得到相似度值;判断所述相似度值是否大于预设相似度阈值,若所述相似度值大于预设相似度阈值则判定所述待检测可执行文件为恶意可执行文件。2.根据权利要求1所述的可执行文件检测方法,其特征在于,所述对待检测可执行文件进行文字提取并进行预处理以得到预处理文本,包括:利用预设文字提取工具对待检测可执行文件进行文字提取以得到初始文本;利用预设预处理方法确定所述初始文本中的待修正文字内容,并对所述待修正文字内容进行相应的修正处理,以得到相应的预处理文本。3.根据权利要求1所述的可执行文件检测方法,其特征在于,所述利用预设恶意文本知识图谱集对所述预处理文本进行向量化以得到向量化集合,包括:将所述预处理文本转化为预设词向量模型所需格式的词列表;调用所述预设词向量模型中的转换方法,并根据所述预设恶意文本知识图谱集中的各恶意文本知识图谱分别对所述词列表进行向量化,得到包含与各所述恶意文本知识图谱对应的文本向量的向量化集合。4.根据权利要求3所述的可执行文件检测方法,其特征在于,所述利用预设相似度计算算法计算所述向量化集合和所述预设恶意文本知识图谱集之间的相似度以得到相似度值,包括:基于预设降噪集对各所述文本向量进行降噪处理以得到各降噪后文本向量;利用预设相似度计算算法对各降噪后文本向量与相应的所述恶意文本知识图谱的相似度进行计算,以得到相应的相似度值。5.根据权利要求1所述的可执行文件检测方法,其特征在于,所述判断所述相似度值是否大于预设相似度阈值,若所述相似度值大于预设相似...

【专利技术属性】
技术研发人员:王宏斐王欣
申请(专利权)人:杭州安恒信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1