一种文件处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34477404 阅读:36 留言:0更新日期:2022-08-10 08:52
本发明专利技术提供一种文件处理方法、装置、电子设备及存储介质,该方法包括:以设定词语作为结束节点对待处理文件的代码进行拆分,得到若干代码段;根据若干代码段,确定待处理文件的文件特征信息;根据文件特征信息确定待处理文件的文件标识。本申请根据特征信息确定出待处理文件的文件标识,使得文件标识中包含了待处理文件的特征信息,能够更直观的获取到待处理文件特征。相较于一般的使用以行或固定词数进行定长的拆分,本申请通过设定词语作为结束节点,对待处理文件的代码进行拆分,得到的若干代码段是不定长的,能够有效避免由多个词语组成的长段代码被拆分成多个,导致进行特征提取时连续特征被破坏使得最终的特征信息存在缺失的问题。失的问题。失的问题。

【技术实现步骤摘要】
一种文件处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及网络安全数据处理领域,尤其涉及一种文件处理方法、装置、电子设备及存储介质。

技术介绍

[0002]恶意代码分析人员及普通用户,对恶意代码最直观的了解往往是通过病毒名。同时,在对恶意代码的数据统计过程中,往往也是通过病毒名进行分类,归并。但随着恶意代码加壳,变形,多态等技术越来越多,使得病毒检测已经不能仅靠特征检测,动态行为及一些启发式检测,其病毒名多为无意义的兜底名字,诸如Agent,Malicious,Gen,Malware,Suspicious等,或是无意义的一串数字。这导致分析人员在初步接触该恶意代码时,无法在第一时间对样本做出准确判断,在数据统计上,也无法快速对同一家族进行归类,进而进行整体分析。

技术实现思路

[0003]有鉴于此,本专利技术提供一种文件处理方法、装置、电子设备及存储介质,至少部分解决现有技术中存在的问题。
[0004]根据本申请的一个方面,提供一种文件处理方法,包括:
[0005]以设定词语作为结束节点对待处理文件的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文件处理方法,其特征在于,包括:以设定词语作为结束节点对待处理文件的代码进行拆分,得到若干代码段;根据若干所述代码段,确定所述待处理文件的文件特征信息;根据所述文件特征信息确定所述待处理文件的文件标识。2.根据权利要求1所述的文件处理方法,其特征在于,所述以设定词语作为结束节点对待处理文件的代码进行拆分,得到若干代码段,包括:根据所述待处理文件,得到所述待处理文件的汇编代码;以设定词语为结束节点对所述汇编代码进行拆分,得到若干所述代码段。3.根据权利要求1所述的文件处理方法,其特征在于,所述设定词语为多个,每一代码段仅包含一个所述设定词语,每一所述代码段的最后一个词语为所述设定词语。4.根据权利要求1所述的文件处理方法,其特征在于,所述根据若干所述代码段,确定所述待处理文件的文件特征信息,包括:对若干所述代码段进行聚类,得到至少一个代码段集合;确定每一代码段集合对应的集合特征信息;根据每一所述集合特征信息,确定所述待处理文件对应的文件特征信息。5.根据权利要求4所述的文件处理方法,其特征在于,同一所述代码段集合中的每一代码段均相同;所述确定每一代码段集合对应的集合特征信息,包括:针对每一所述代码段集合,确定其内部所述代码段的数量以及任一所述代码段对应的代码特征信息;根据所述代码段的数量和代码特征信息,确定对应的代码段集合的集合特征信息。6.根据权利要求1所述的文件...

【专利技术属性】
技术研发人员:叶佳旭童志明肖新光
申请(专利权)人:安天科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1