【技术实现步骤摘要】
软件分类模型训练方法、分类方法、装置、模型、及设备
[0001]本申请涉及深度学习
,具体而言,涉及一种软件分类模型训练方法、分类方法、装置、模型及设备。
技术介绍
[0002]随着互联网技术和计算机技术的不断发展,恶意软件也不断地在进化。诸如间谍软件、病毒、木马和蠕虫等具有恶意行为的恶意软件越来越多样,威胁也越来越大。为了更好地对抗恶意软件,需要对其恶意性进行检测并分类,从而能更加深入地了解恶意软件的恶意行为和特点,包括传播途径、攻击对象、攻击方式等信息,从而能有针对性地进行防范,制定相应的防御策略。
[0003]在相关技术中,越来越多先进的深度学习方法被提出应用到恶意软件的分类任务中。然而基于深度学习的恶意软件分类方法解释性较差,同时分类效果也有待提升,而这些都是本领域亟待解决的技术问题。
技术实现思路
[0004]本申请实施例的目的在于提供一种软件分类模型训练方法、分类方法、装置、模型及设备,用以至少解决上述提及的任意一个或多个技术问题。
[0005]本申请实施例第一方面提供了一种软件分类模型的训练方法,所述软件分类模型包括语义嵌入子模型、函数分类器与恶意家族分类器,所述方法包括:
[0006]获取第一二进制样本中函数的第一控制流图、第二二进制样本中函数的第二控制流图、以及第三二进制样本中函数的第三控制流图;
[0007]利用所述第一控制流图包括的汇编指令对所述语义嵌入子模型进行训练;
[0008]利用已训练的语义嵌入子模型提取所述第二控制流图与所述 ...
【技术保护点】
【技术特征摘要】
1.一种软件分类模型的训练方法,其特征在于,所述软件分类模型包括语义嵌入子模型、函数分类器与恶意家族分类器,所述方法包括:获取第一二进制样本中函数的第一控制流图、第二二进制样本中函数的第二控制流图、以及第三二进制样本中函数的第三控制流图;利用所述第一控制流图包括的汇编指令对所述语义嵌入子模型进行训练;利用已训练的语义嵌入子模型提取所述第二控制流图与所述第三控制流图的语义特征,得到携带语义特征的第二属性控制流图与第三属性控制流图;利用所述第二属性控制流图对所述函数分类器进行训练;利用已训练的函数分类器对所述第三属性控制流图进行分类,得到函数的分类标签,并将携带所述分类标签的第三属性控制流图对所述恶意家族分类器进行训练,得到已训练的软件分类模型。2.根据权利要求1所述的方法,其特征在于,所述函数分类器包括图重构模型;所述利用所述第二属性控制流图对所述函数分类器进行训练,包括:从所述第二属性控制流图中获取目标第二属性控制流图;其中,所述目标第二属性控制流图对应的函数属于目标类别,所述目标类别包括良性类别或恶意类别;利用所述目标第二属性控制流图对所述函数分类器进行训练。3.根据权利要求1所述的方法,其特征在于,所述第三二进制样本包括良性函数与恶意函数;所述利用已训练的函数分类器对所述第三属性控制流图进行分类,得到函数的分类标签,并将携带所述分类标签的第三属性控制流图对所述恶意家族分类器进行训练,包括:利用已训练的函数分类器对所述第三属性控制流图进行分类;若所述第三属性控制流图对应的函数分类至恶意类别,确定所述分类标签为所述第三二进制样本所属恶意家族对应的家族标签;若所述第三属性控制流图对应的函数分类至良性类别,确定所述分类标签为良性标签;将携带所述家族标签的第三属性控制流图对所述恶意家族分类器进行训练;或者将携带所述家族标签的第三属性控制流图、以及携带所述良性标签的第三属性控制流图对所述恶意家族分类器进行训练。4.根据权利要求1
‑
3任一所述的方法,其特征在于,所述语义嵌入子模型包括双向编码BERT模型;所述恶意家族分类器包括图神经网络模型。5.一种软件分类方法,其特征在于,所述分类方法基于如权利要求1所述方法训练得到的软件分类模型实现;所述软件分类模型包括语义嵌入子模型、函数分类器与恶意家族分类器;所述分类方法包括:获取待分类二进制文件中每个函数对应的第四控制流图;利用所述语义嵌入子模型提取所有所述第四控制流图的语义特征,得到每个所述第四控制流图对应的携带语义特征的第四属性控制流图;利用所述函数分类器从所有所述第四属性控制流图中分类出属于恶意类别的目标属性控制流图;将所述目标属性控制流图输入所述恶意家族分类器,并根据所述恶意家族分类器的输出结果确定所述待分类二进制文件所属的恶意家族。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:若所有所述第四属性控制流图均不属于所述恶意类别,确定所述待分类二进制文件为良性软件。7.根据权利要求5所述的方法,其特征在于,所述输出结果包括所述目标属性控制流图对应每个恶意家族类别的概率分布...
【专利技术属性】
技术研发人员:熊嘉琦,陈国强,安晓宁,
申请(专利权)人:北京天融信网络安全技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。