System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文件转换方法、文件识别方法、装置和电子设备制造方法及图纸_技高网
当前位置: 首页 > 专利查询>郑宇森专利>正文

文件转换方法、文件识别方法、装置和电子设备制造方法及图纸

技术编号:40274144 阅读:7 留言:0更新日期:2024-02-02 23:00
本申请提供了一种文件转换方法、文件识别方法、装置和电子设备,其中,该方法包括:根据待处理文件的文件大小,确定出所述待处理文件对应的转换图像的图像尺寸;根据所述待处理文件的内容信息和分布信息,确定出所述转换图像的多个颜色通道的数值矩阵,以得到所述转换图像。

【技术实现步骤摘要】

本申请涉及计算机,具体而言,涉及一种文件转换方法、文件识别方法、装置和电子设备


技术介绍

1、在计算机系统中,恶意可执行文件对windows操作系统造成的危害日益严重,给信息安全带来了巨大挑战。这些恶意文件不仅可能窃取敏感数据,还可能对系统稳定性和可用性造成严重损害,给用户、组织和企业带来了巨大风险。

2、因此,针对恶意可执行文件的识别技术可以辨别恶意可执行文件所述的类别。这种实现方式可以实现一部分恶意代码的识别,但是这种处理方式,对恶意代码的识别的准确率还存在不足。


技术实现思路

1、本申请的目的在于提供一种文件转换方法、文件识别方法、装置和电子设备,能够改善基于灰度图像对恶意代码的识别的准确率还存在不足的问题。

2、第一方面,本专利技术提供一种文件转换方法,包括:根据待处理文件的文件大小,确定出所述待处理文件对应的转换图像的图像尺寸;根据所述待处理文件的内容信息和分布信息,确定出所述转换图像的多个颜色通道的数值矩阵,以得到所述转换图像。

3、在本申请实施例中,通过对待处理文件的充分处理,从中提取出内容信息和分布信息,以得到多通道的图像数据,从而可以使该图像数据能够更好地包含待处理文件的关键信息,基于该图像数据的恶意代码的检测也能够更加的准确。

4、在可选的实施方式中,所述文件大小包括所述待处理文件中的字节数量;所述根据待处理文件的文件字节大小,确定出所述待处理文件对应的转换图像的图像尺寸,包括:对所述待处理文件的字节进行填充,以确定出包含预设标准数量的字节的中间文件;根据所述预设标准数量确定出所述待处理文件对应的转换图像的图像尺寸。

5、在上述实施方式中,通过将对所述待处理文件的字节进行填充,以此确定出图像尺寸,可以实现图像尺寸的大小能够更好地容纳文件信息,从而也降低文件信息丢失的可能性,也就能够使得到的图像对应的检测结果可以更加准确。

6、在可选的实施方式中,所述预设标准数量为完全平方数;所述对所述待处理文件的字节进行填充,以确定出包含预设标准数量的字节的中间文件,包括:对所述待处理文件的字节进行填充,直到填充后的待处理文件的字节数量为完全平方数,以确定出中间文件;所述根据所述预设标准数量确定出所述待处理文件对应的转换图像的图像尺寸,包括:根据所述完全平方数的平方根,确定出为所述转换图像的图像尺寸的长和宽。

7、在可选的实施方式中,所述多个颜色通道包括第一颜色通道、第二颜色通道和第三颜色通道;

8、所述根据所述待处理文件的内容信息和分布信息,确定出所述转换图像的多个颜色通道的数值矩阵,以得到所述转换图像,包括:根据所述待处理文件的所述内容信息,确定出所述第一颜色通道的第一矩阵;根据所述待处理文件的所述分布信息,确定出所述第二颜色通道的第二矩阵;根据所述待处理文件的所述分布信息,确定出所述第三颜色通道的第三矩阵;将所述第一颜色通道的第一矩阵、所述第二颜色通道的第二矩阵以及所述第三颜色通道的第三矩阵进行叠加,以得到所述转换图像。

9、在上述实施方式中,将结合待处理文件的内容信息和分布信息分别确定出三个颜色通道的矩阵,以得到待处理文件对应的彩色图像,可以实现彩色图像更全面地包含待处理文件的信息,也能够使基于该彩色图像得到的待处理文件的检测结果更加准确。

10、在可选的实施方式中,所述内容信息包括待处理文件的字节流信息,所述字节流信息包括多个比特流组合;所述根据所述待处理文件的所述内容信息,确定出所述第一颜色通道的值,包括:按照设定字节大小依次读取所述待处理文件的比特流组合;依次将所述比特流组合转化为所述第一颜色通道内的颜色数值;根据所述待处理文件在所述第一颜色通道内的所有数值,构建以所述图像尺寸对应大小的第一矩阵。

11、在可选的实施方式中,所述分布信息包括:所述待处理文件的结构分布信息;所述根据所述待处理文件的所述分布信息,确定出所述第二颜色通道的第二矩阵,包括:根据所述结构分布信息将所述待处理文件划分为多组文件结构段;根据多组所述文件结构段确定出所述待处理文件在所述第二颜色通道的颜色数值;根据所述待处理文件的在所述第二颜色通道的所有数值,构建以所述图像尺寸对应大小的第二矩阵。

12、在可选的实施方式中,所述根据多组所述文件结构段确定出所述待处理文件在所述第二颜色通道的颜色数值通过以下方式实现:

13、

14、其中,其中,上述公式表示第i个文件结构段在第二颜色通道的颜色数值;#sections表示所述待处理文件所包含的文件结构段的总数。

15、在可选的实施方式中,所述分布信息包括:所述待处理文件的字节分布信息,所述字节分布信息包括所述待处理文件的每个字节在所述待处理文件中出现的频数;针对所述待处理文件中的每个字节,根据所述字节的字节频数确定出在所述第三颜色通道的颜色数值;根据所述待处理文件的在所述第三颜色通道的所有数值,构建以所述图像尺寸对应大小的第三矩阵。

16、在上述几个实施方式中,充分利用待处理文件的各类信息确定出各个颜色通道的矩阵,以此构建的彩色图像能够相对准确地呈现待处理文件的信息。

17、第二方面,本专利技术提供一种文件识别方法,包括:将待识别文件使用前述实施方式任意一项所述的方法进行转换,以得到待识别图像;将所述待识别图像使用目标图像分类模型,对所述待识别图像进行分类,以确定所述待识别文件所属的恶意代码类别。

18、第三方面,本专利技术提供一种文件转换装置,包括:尺寸确定模块,用于根据待处理文件的文件大小,确定出所述待处理文件对应的转换图像的图像尺寸;图像确定模块,用于根据所述待处理文件的内容信息和分布信息,确定出所述转换图像的多个颜色通道的数值矩阵,以得到所述转换图像。

19、第四方面,本专利技术提供一种文件识别装置,包括:转换模块,用于将待识别文件使用前述实施方式任意一项所述的方法进行转换,以得到待识别图像;识别模块,用于将所述待识别图像使用目标图像分类模型,对所述待识别图像进行分类,以确定所述待识别文件所属的恶意代码类别。

20、第五方面,本专利技术提供一种电子设备,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如前述实施方式任意一项所述的方法的步骤。

21、第六方面,本专利技术提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如前述实施方式任意一项所述的方法的步骤。

本文档来自技高网...

【技术保护点】

1.一种文件转换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述文件大小包括所述待处理文件中的字节数量;所述根据待处理文件的文件字节大小,确定出所述待处理文件对应的转换图像的图像尺寸,包括:

3.根据权利要求2所述的方法,其特征在于,所述预设标准数量为完全平方数;

4.根据权利要求1所述的方法,其特征在于,所述多个颜色通道包括第一颜色通道、第二颜色通道和第三颜色通道;

5.根据权利要求4所述的方法,其特征在于,所述内容信息包括待处理文件的字节流信息,所述字节流信息包括多个比特流组合;

6.根据权利要求4所述的方法,其特征在于,所述分布信息包括:所述待处理文件的结构分布信息;

7.根据权利要求6所述的方法,其特征在于,所述根据多组所述文件结构段确定出所述待处理文件在所述第二颜色通道的颜色数值通过以下方式实现:

8.根据权利要求4所述的方法,其特征在于,所述分布信息包括:所述待处理文件的字节分布信息,所述字节分布信息包括所述待处理文件的每个字节在所述待处理文件中出现的频数;p>

9.一种文件识别方法,其特征在于,包括:

10.一种文件转换装置,其特征在于,包括:

11.一种文件识别装置,其特征在于,包括:

12.一种电子设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如权利要求1至9任意一项所述的方法的步骤。

13.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任意一项所述的方法的步骤。

...

【技术特征摘要】

1.一种文件转换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述文件大小包括所述待处理文件中的字节数量;所述根据待处理文件的文件字节大小,确定出所述待处理文件对应的转换图像的图像尺寸,包括:

3.根据权利要求2所述的方法,其特征在于,所述预设标准数量为完全平方数;

4.根据权利要求1所述的方法,其特征在于,所述多个颜色通道包括第一颜色通道、第二颜色通道和第三颜色通道;

5.根据权利要求4所述的方法,其特征在于,所述内容信息包括待处理文件的字节流信息,所述字节流信息包括多个比特流组合;

6.根据权利要求4所述的方法,其特征在于,所述分布信息包括:所述待处理文件的结构分布信息;

7.根据权利要求6所述的方法,其特征在于,所述根据多组所述文件结构段确定出所述待处理文件在所...

【专利技术属性】
技术研发人员:郑宇森安晓宁
申请(专利权)人:郑宇森
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1