一种代码标识方法及装置制造方法及图纸

技术编号:22167681 阅读:69 留言:0更新日期:2019-09-21 10:55
本申请提供了一种代码标识方法及装置,其中,该方法包括:从待标识的代码中提取目标字符串;根据预先训练好的关键词提取模型,从所述目标字符串中提取所述待标识的代码的目标关键词;根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识。通过这种方法,可以提高代码分析的效率和准确率。

A Code Identification Method and Device

【技术实现步骤摘要】
一种代码标识方法及装置
本申请涉及计算机,互联网,信息安全
,具体而言,涉及一种代码标识方法及装置。
技术介绍
目前,随着网络信息技术的发展,恶意软件已成为危害网络公共安全的主要威胁之一。据瑞星2017年信息安全报告指出,2017年中国共有11.45亿人次被恶意软件感染,有2300万台电脑受到攻击。2017年1至12月新增恶意软件达3310万余个,总数量比2016年同期增长163%。随着恶意软件数目的爆发式增长,传统的基于特征码与签名的恶意代码分析技术已不能满足新兴的恶意代码检测需求。安全研究人员通过分析大量的恶意代码发现,其中许多新出现的恶意代码是已有恶意代码的变种。恶意代码的编写者通过变形、加壳、多态等技术手段,混淆已有恶意代码的特征,企图逃避安全软件的分析检测。虽然现有技术中,基于行为的主动防御、虚拟机脱壳等技术可以检测经过变形、加壳的恶意代码,但却不能快速有效地识别代码中所包含的信息,因此,在对恶意代码进行分析时准确率和效率较低。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种代码标识方法及装置,能够对恶意代码进行高效、准确的分析。第一方面,本申请实施例提供了一种代码标识方法,包括:从待标识的代码中提取目标字符串;根据预先训练好的关键词提取模型,从所述目标字符串中提取所述待标识的代码的目标关键词;根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识。结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述从待标识的代码中提取目标字符串之前,所述方法还包括:判断所述待标识的代码是否加壳;针对所述待标识的代码有加壳的情况,对所述待标识的代码进行脱壳处理。结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述从待标识的代码中提取目标字符串,包括:从所述待标识的代码中提取关键字符串;所述关键字符串包括:链接和/或路径;基于所述关键字符串中包括的预设目标符号,从所述关键字符串中提取目标字符串。结合第一方面的第二种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述从所述待标识的代码中提取关键字符串,包括:使用正则表达式,匹配所述关键字符串中的目标标志符号;根据匹配到的所述目标标志符号,提取所述待标识的代码中的链接,和/或,路径,得到所述待标识的代码的关键字符串。结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识,包括:将所述目标关键词与每一个预先设置的关键词集合中所包含的关键词进行匹配,并将匹配成功的关键词所在的集合确定为目标关键词集合;获取所述目标关键词集合的目标标识;将所述目标标识以及所述匹配成功的关键词确定为所述待标识的代码的标识。第二方面,本申请实施例提供了一种代码标识装置,包括:第一提取模块,用于从待标识的代码中提取目标字符串;第二提取模块,用于根据预先训练好的关键词提取模型,从所述目标字符串中提取所述待标识的代码的目标关键词;标识模块,用于根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识。结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述装置还包括:脱壳处理模块,用于从待标识的代码中提取目标字符串之前,判断所述待标识的代码是否加壳,针对所述待标识的代码有加壳的情况,对所述待标识的代码进行脱壳处理。结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述第一提取模块,在从所述待标识的代码中提取目标字符串时,具体用于:从所述待标识的代码中提取关键字符串;所述关键字符串包括:链接和/或路径;基于所述关键字符串中包括的预设目标符号,从所述关键字符串中提取目标字符串。结合第二方面的第二种可能的实施方式,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述第一提取模块,在从所述待标识的代码中提取关键字符串时,具体用于:使用正则表达式,匹配所述关键字符串中的目标标志符号;根据匹配到的所述目标标志符号,提取所述待标识的代码中的链接,和/或,路径,得到所述待标识的代码的关键字符串。结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中,所述标识模块,在根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识时,具体用于:将所述目标关键词与每一个预先设置的关键词集合中所包含的关键词进行匹配,并将匹配成功的关键词所在的集合确定为目标关键词集合;获取所述目标关键词集合的目标标识;将所述目标标识以及所述匹配成功的关键词确定为所述待标识的代码的标识。第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面的任一种可能的实施方式中的步骤。第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面的任一种可能的实施方式中的步骤。本申请实施例提供的代码标识方法及装置,在对代码进行识别时,首先从待标识的代码中提取目标字符串;然后根据预先训练好的关键词提取模型,从所述目标字符串中提取所述待标识代码的目标关键词;最后根据所述待标识代码的目标关键词,以及至少一个预先设置的关键词集合,对待标识的代码进行标识。通过上述方法,可以准确识别出代码中的关键词,提高了对代码分析的效率和准确率。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1示出了本申请实施例所提供的一种代码标识方法的流程图;图2示出了本申请实施例所提供的恶意代码识别方法中,从待标识代码中提取目标字符串的流程图;图3示出了本申请实施例所提供的关键词提取模型获取的方法流程图;图4示出了本申请实施例所提供的提取待标识代码的目标关键词的流程图;图5示出了本申请实施例所提供的一种代码标识装置的结构示意图;图6示出了本申请实施例所提供的一种电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实本文档来自技高网...

【技术保护点】
1.一种代码标识方法,其特征在于,包括:从待标识的代码中提取目标字符串;根据预先训练好的关键词提取模型,从所述目标字符串中提取所述待标识的代码的目标关键词;根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识。

【技术特征摘要】
1.一种代码标识方法,其特征在于,包括:从待标识的代码中提取目标字符串;根据预先训练好的关键词提取模型,从所述目标字符串中提取所述待标识的代码的目标关键词;根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识。2.根据权利要求1所述的方法,其特征在于,在从待标识的代码中提取目标字符串之前,所述方法还包括:判断所述待标识的代码是否加壳;针对所述待标识的代码有加壳的情况,对所述待标识的代码进行脱壳处理。3.根据权利要求1所述的方法,其特征在于,所述从待标识的代码中提取目标字符串,包括:从所述待标识的代码中提取关键字符串;所述关键字符串包括:链接和/或路径;基于所述关键字符串中包括的预设目标符号,从所述关键字符串中提取目标字符串。4.根据权利要求3所述的方法,其特征在于,所述从所述待标识的代码中提取关键字符串,包括:使用正则表达式,匹配所述关键字符串中的目标标志符号;根据匹配到的所述目标标志符号,提取所述待标识的代码中的链接,和/或,路径,得到所述待标识的代码的关键字符串。5.根据权利要求1所述的方法,其特征在于,所述根据所述待标识的代码的目标关键词以及至少一个预先设置的关键词集合,对所述待标识的代码进行标识,包括:将所述目标关键词与每一个预先设置的关键词集合中所包含的关键词进行匹配,并将匹配成功的关键词所在的集合确定为目标关键词集合;获取所述目标关键词集合的目标标识;将所述目标标识以及所述匹配成功的关键词确定为所述待标识的代码的标识。6.一种代码标识装置,其特征在于,包括:第一提取模块,用于从待标识...

【专利技术属性】
技术研发人员:李祺李唯实苏冠宇
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1