一种文件处理方法、设备及计算机可读存储介质技术

技术编号：38360456 阅读：8 留言：0更新日期：2023-08-05 17:30

本申请公开了一种文件处理方法，该方法包括：获取样本恶意文件和样本非恶意文件；确定样本恶意文件中的第一字符信息的第一重要程度和样本非恶意文件中的第二字符信息的第二重要程度；基于第一重要程度和第一字符信息确定第一样本特征信息，并基于第二重要程度和第二字符信息确定第二样本特征信息；基于第一样本特征信息和第二样本特征信息进行模型训练，得到目标文件识别模型。本申请实施例还公开了一种文件处理设备及计算机可读存储介质。一种文件处理设备及计算机可读存储介质。一种文件处理设备及计算机可读存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
一种文件处理方法、设备及计算机可读存储介质

[0001]本申请涉及文件处理领域，尤其涉及一种文件处理方法、设备及计算机可读存储介质。

技术介绍

[0002]可执行与可链接格式(Executable and Linkable Format，ELF)文件是一种可执行可链接格式的二进制文件，被广泛应用于计算机中；但是，当ELF文件中携带有恶意病毒时，会导致计算机被恶意病毒攻击。为了避免上述情况发生，相关技术中根据人为经验对ELF文件进行分析确定病毒规则，并基于病毒规则对待分析ELF文件进行检测，以此来确定待分析ELF文件是否为恶意文件。但是，相关技术中这种基于人为经验确定的病毒规则不准确，导致对待分析ELF文件是否为恶意文件的判断不准确，甚至会存在误判的情况。

技术实现思路

[0003]为解决上述技术问题，本申请实施例提供一种文件处理方法、设备及计算机可读存储介质，解决了相关技术中对待分析ELF文件是否为恶意文件的判断不准确的问题，避免了误判的情况发生。
[0004]本申请的技术方案是这样实现的：
[0005]一种文件处理方法，所述方法包括：
[0006]获取样本恶意文件和样本非恶意文件；
[0007]确定所述样本恶意文件中的第一字符信息的第一重要程度和所述样本非恶意文件中的第二字符信息的第二重要程度；
[0008]基于所述第一重要程度和所述第一字符信息确定第一样本特征信息，并基于所述第二重要程度和所述第二字符信息确定第二样本特征信息；
[0009]基于所述第...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法，其特征在于，所述方法包括：获取样本恶意文件和样本非恶意文件；确定所述样本恶意文件中的第一字符信息的第一重要程度和所述样本非恶意文件中的第二字符信息的第二重要程度；基于所述第一重要程度和所述第一字符信息确定第一样本特征信息，并基于所述第二重要程度和所述第二字符信息确定第二样本特征信息；基于所述第一样本特征信息和所述第二样本特征信息进行模型训练，得到目标文件识别模型。2.根据权利要求1所述的方法，其特征在于，所述获取样本恶意文件和所述样本非恶意文件，包括：获取多个时间段的样本恶意文件，并确定所述多个时间段中所述样本恶意文件的第一分布情况；基于所述第一分布情况，获取所述样本非恶意文件。3.根据权利要求1所述的方法，其特征在于，所述确定所述样本恶意文件中的第一字符信息的第一重要程度和所述样本非恶意文件中的第二字符信息的第二重要程度，包括：基于所述样本恶意文件中第一字符串的第二分布情况和所述第一字符串的第一上下文信息，确定所述第一字符串的第一重要程度；其中，所述第一字符信息包括所述第一字符串；基于所述样本非恶意文件中第二字符串的第三分布情况和所述第二字符串的第二上下文信息，确定所述第二字符串的第二重要程度；其中，所述第二字符信息包括所述第二字符串。4.根据权利要求3所述的方法，其特征在于，所述基于所述第一重要程度和所述第一字符信息确定第一样本特征信息，并基于所述第二重要程度和所述第二字符信息确定第二样本特征信息，包括：基于所述第一重要程度，对所述样本恶意文件中的第一字符串进行筛选，以得到第一初始样本特征信息；基于所述第二重要程度，对所述样本非恶意文件中的第二字符串进行筛选，以得到第二初始样本特征信息；对所述第一样本初始特征信息进行降维处理，得到所述第一样本特征信息；对所述第二样本初始特征信息进行降维处理，得到所述第二样本特征信息。5.根据权利要求1所述的方法，其特征在于，所述基于所述第一样本特征信息和所述第二样本特征信息进行模型训练，得到目标文件识别模型，包括：对所述第二样本特征信...

【专利技术属性】
技术研发人员：黄晟，宋汝鹏，徐敬蘅，
申请(专利权)人：深圳市深信服信息安全有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人