【技术实现步骤摘要】
一种文件处理方法、装置、电子设备及存储介质
[0001]本专利技术涉及网络安全数据处理领域,尤其涉及一种文件处理方法、装置、电子设备及存储介质。
技术介绍
[0002]恶意代码分析人员及普通用户,对恶意代码最直观的了解往往是通过病毒名。同时,在对恶意代码的数据统计过程中,往往也是通过病毒名进行分类,归并。但随着恶意代码加壳,变形,多态等技术越来越多,使得病毒检测已经不能仅靠特征检测,动态行为及一些启发式检测,其病毒名多为无意义的兜底名字,诸如Agent,Malicious,Gen,Malware,Suspicious等,或是无意义的一串数字。这导致分析人员在初步接触该恶意代码时,无法在第一时间对样本做出准确判断,在数据统计上,也无法快速对同一家族进行归类,进而进行整体分析。
技术实现思路
[0003]有鉴于此,本专利技术提供一种文件处理方法、装置、电子设备及存储介质,至少部分解决现有技术中存在的问题。
[0004]根据本申请的一个方面,提供一种文件处理方法,包括:
[0005]以设定词语作为结 ...
【技术保护点】
【技术特征摘要】
1.一种文件处理方法,其特征在于,包括:以设定词语作为结束节点对待处理文件的代码进行拆分,得到若干代码段;根据若干所述代码段,确定所述待处理文件的文件特征信息;根据所述文件特征信息确定所述待处理文件的文件标识。2.根据权利要求1所述的文件处理方法,其特征在于,所述以设定词语作为结束节点对待处理文件的代码进行拆分,得到若干代码段,包括:根据所述待处理文件,得到所述待处理文件的汇编代码;以设定词语为结束节点对所述汇编代码进行拆分,得到若干所述代码段。3.根据权利要求1所述的文件处理方法,其特征在于,所述设定词语为多个,每一代码段仅包含一个所述设定词语,每一所述代码段的最后一个词语为所述设定词语。4.根据权利要求1所述的文件处理方法,其特征在于,所述根据若干所述代码段,确定所述待处理文件的文件特征信息,包括:对若干所述代码段进行聚类,得到至少一个代码段集合;确定每一代码段集合对应的集合特征信息;根据每一所述集合特征信息,确定所述待处理文件对应的文件特征信息。5.根据权利要求4所述的文件处理方法,其特征在于,同一所述代码段集合中的每一代码段均相同;所述确定每一代码段集合对应的集合特征信息,包括:针对每一所述代码段集合,确定其内部所述代码段的数量以及任一所述代码段对应的代码特征信息;根据所述代码段的数量和代码特征信息,确定对应的代码段集合的集合特征信息。6.根据权利要求1所述的文件...
【专利技术属性】
技术研发人员:叶佳旭,童志明,肖新光,
申请(专利权)人:安天科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。