【技术实现步骤摘要】
一种程序处理方法、装置以及相关设备
本专利技术涉及计算机
,尤其涉及一种程序处理方法、装置以及相关设备。
技术介绍
Internet(互联网)的发展和普及改变了人们的生活方式和工作方式,人们的生活和工作变成更加便利和高效,社会进入了信息化时代。随着社会信息化程度的不断提高,工业、国防、教育、金融等社会各行各业的信息越来越依赖计算机和互联网。然而,恶意程序直接威胁着个人、企业的利益,数据显示,84%的网民都遭受过恶意程序所带来的网络攻击。因此,对恶意程序的识别具有重要的社会价值。现有技术对恶意程序的识别主要基于有监督的方法,即利用大量带有标签的正常程序和带有标签的恶意程序训练一个识别模型,该识别模型可以拟合恶意程序和正常程序的数据分布,进而对后续未知的程序进行识别,参与模型训练的样本程序的数量会直接决定识别模型的准确率。但是,每一个参与训练的样本程序都需要由人工验证是正常程序或者是恶意程序后,再手动为该程序设置对应的标签,造成为程序设置标签的效率低、带标签的样本程序的数量少,进而导致识别模型的识别准确率低下。
技术实现思路
本专利技术实施例提供一种程序处理方法、装 ...
【技术保护点】
1.一种程序处理方法,其特征在于,包括:获取多个样本程序,并获取与每个样本程序分别对应的行为参数值,根据与所述每个样本程序分别对应的行为参数值,确定与所述每个样本程序分别对应的样本特征向量;将所述样本特征向量划分为多个向量集合,根据每个样本特征向量与所述向量集合之间的关联关系,确定与所述每个样本特征向量分别对应的样本行为状态;根据所述样本行为状态,确定与所述每个样本程序分别对应的安全标签;所述安全标签包括正常标签和异常标签;根据所述多个样本程序和每个样本程序分别对应的安全标签,生成程序识别模型;所述程序识别模型是用于识别目标程序的安全类型。
【技术特征摘要】
1.一种程序处理方法,其特征在于,包括:获取多个样本程序,并获取与每个样本程序分别对应的行为参数值,根据与所述每个样本程序分别对应的行为参数值,确定与所述每个样本程序分别对应的样本特征向量;将所述样本特征向量划分为多个向量集合,根据每个样本特征向量与所述向量集合之间的关联关系,确定与所述每个样本特征向量分别对应的样本行为状态;根据所述样本行为状态,确定与所述每个样本程序分别对应的安全标签;所述安全标签包括正常标签和异常标签;根据所述多个样本程序和每个样本程序分别对应的安全标签,生成程序识别模型;所述程序识别模型是用于识别目标程序的安全类型。2.根据权利要求1所述的方法,其特征在于,还包括:当接收到程序识别请求时,根据所述程序识别请求获取所述目标程序,并获取与所述目标程序对应的行为参数值,根据与所述目标程序对应的行为参数值,确定目标特征向量;基于所述程序识别模型,对所述目标特征向量进行识别处理,得到与所述目标特征向量相匹配的安全标签,将所述程序识别模型识别的安全标签所指示的安全类型确定为与所述目标程序对应的安全类型。3.根据权利要求1所述的方法,其特征在于,所述获取与每个样本程序分别对应的行为参数值,根据与所述每个样本程序分别对应的行为参数值,确定与所述每个样本程序分别对应的样本特征向量,包括:获取与样本程序对应的多个原始参数值,在所述多个原始参数值中,提取表征程序操作行为的原始参数值,作为条件参数值;将处于目标数值范围内的条件参数值调整为与所述目标数值范围相匹配的目标数值,将所述目标数值确定为与所述样本程序对应的行为参数值,将与所述样本程序对应的行为参数值组合为所述样本特征向量。4.根据权利要求1所述的方法,其特征在于,所述将所述样本特征向量划分为多个向量集合,根据每个样本特征向量与所述向量集合之间的关联关系,确定与所述每个样本特征向量分别对应的样本行为状态,包括:获取与所述多个样本特征向量相关联的目标孤立森林,提取所述目标孤立森林中的目标孤立树中的第一节点对应的节点记录,作为第一记录;将所述多个样本特征向量作为第一辅助向量,根据所述第一记录,将所述第一辅助向量划分为所述向量集合;所述向量集合包括待划分向量集合;提取所述第二节点对应的节点记录,作为第二记录;所述第二节点是在所述目标孤立树中所述第一节点的子节点;将所述第二节点作为所述第一节点,并将所述第二记录作为所述第一记录,并将所述待划分向量集合中包含的样本特征向量作为所述第一辅助向量;当所述第二节点中不存在节点记录时,统计和样本特征向量之间存在关联关系的向量集合的数量,根据所统计的向量集合的数量确定所述样本特征向量在所述目标孤立树中的高度;根据所述样本特征向量在每个目标孤立树中的高度,确定与所述样本特征向量对应的样本行为状态。5.根据权利要求4所述的方法,其特征在于,还包括:获取多个训练程序,并获取与每个训练程序分别对应的行为参数值,根据与所述每个训练程序分别对应的行为参数值,确定多个训练特征向量;从所述多个训练特征向量中提取一组训练特征向量,作为基向量,根据所述基向量和所述基向量所包含的所有行为参数属性,构建目标孤立树;从所述多个训练特征向量中提取下一组训练特征向量,作为所述基向量;当基于多组所述基向量分别构建得到的所述目标孤立树的数量大于第一数量阈值时,将所有目标孤立树确定为所述目标孤立森林。6.根据权利要求5所述的方法,其特征在于,所述根据所述基向量和所述基向量所包含的所有行为参数属性,构建目标孤立树,包括:创建节点树,根据所述基向量生成第三节点,并将所述第三节点添加至所述节点树;将所述基向量确定为第二辅助向量,从所述第二辅助向量所包含的所有行为参数属性中,选择一个行为参数属性,作为节点属性,根据所有第二辅助向量中的节点属性的行为参数值,确定节点属性值;将所述节点属性和节点属性值组合为节点记录添加至所述第三节点,根据所述节点属性和所述节点属性值,将所述第二辅助向量划分为第一子向量和第二子向量,根据所述第一子向量和所述第二子向量分别生成第四节点,将所述第四节点作为所述第三节点的子节点添加至所述节点树;将所述第四节点确定为所述第三节点,并将所述第一子向量和所述第二子向量均确定为所述第二辅助向量;当所述节点树满足收敛条件时,将所述节点树确定为所述目标孤立树。7.根据权利要求1所述的方法,其特征在于,所述将所述样本特征向量划分为多个向量集合,根据每个样本特征向量与所述向量集合之间的关联关系,确定与所述每个样本特征向量分别对应的样本行为状态,包括:从所述多个样本特征向量中选择一组样本特征向量,作为中心向量;根据所述多个样本特征向量和所述中心向量之间的距离,将所述多个样本特征向量划分为多个特征簇;在每个特征簇中所包含的所有样本特征向量中,分别选择位于中心的样本特征向量,作为所述中心向量;当所述每个特征簇中所包含的样本特征向量保持不变时,将所述多个特征簇确定为所述多个向量集合;将与样本特征向量之间存在关联关系的向量集合的中心向量,作为目标中心向量,计算所述样本特征向量和所述目标中心向量之间的中心距离;根据与所述样本特征向量对应的中心距离,确定与所述样本特征向量对应的样本行为状态。8.根据权利要求1所述的方法,其特征在于,所述根...
【专利技术属性】
技术研发人员:于洋,关塞,陈洁远,曾凡,李家昌,聂利权,阮华,万志颖,王伟,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。