一种威胁检测方法、装置及系统制造方法及图纸

技术编号:35157921 阅读:16 留言:0更新日期:2022-10-12 17:15
本申请公开了一种威胁检测方法、装置及系统,基于从通信设备上采集的待检测数据的第一数据特征和第一决策树确定第一检测结果;基于该待检测数据的第二数据特征和第二决策树确定第二检测结果;根据第一检测结果和第二检测结果确定目标检测结果。上述两个数据特征为待检测数据对应的数据特征变换得到,上述两个决策树为训练所得决策树变换得到,目标检测结果表征待检测数据的威胁程度信息。这样,根据变换后的决策树和变换后的数据特征分别确定检测结果,并利用多个检测结果确定能够该待检测数据的目标检测结果,实现对威胁检测过程的各个环节都进行隐私保护,使得对待检测数据的威胁检测更加全面,从而提升对用户隐私保护的安全性和可靠性。全性和可靠性。全性和可靠性。

【技术实现步骤摘要】
一种威胁检测方法、装置及系统


[0001]本申请涉及安全
,特别是涉及一种威胁检测方法、装置及系统。

技术介绍

[0002]随着互联网和物联网的发展,海量的数据给人们的工作和生活带来了极大的便利,但是这些数据中通常也会包含用户的隐私以及敏感信息,深入分析这些数据可能会导致用户的隐私被挖掘和滥用,所以,产生的海量数据也给用户带来了极大的安全隐患。
[0003]为了给用户提供更好的安全保护,对通信设备采集的数据进行威胁检测。但是,目前对数据进行威胁检测的过程不够完备,导致威胁检测结果不够安全和可靠。
[0004]基于此,亟待提供一种威胁检测方法,能够更加全面和安全的对待检测数据实现威胁检测。

技术实现思路

[0005]基于此,本申请实施例提供了一种威胁检测方法、装置及系统,实现更加全面、安全和可靠的威胁检测,提升对用户的隐私保护。
[0006]第一方面,本申请实施例提供了一种威胁检测方法,该方法例如可以包括:基于待检测数据的第一数据特征和第一决策树确定第一检测结果,并且,基于待检测数据的第二数据特征和第二决策树确定第二检测结果,从而,根据第一检测结果和第二检测结果,确定目标检测结果,该目标检测结果用于表征待检测数据的威胁程度信息,而威胁程度信息可以用于衡量待检测数据存在威胁或者是非法数据的可能性。其中,第一数据特征为从待检测数据中提取的数据特征,第二数据特征为从待检测数据中提取的数据特征,该待检测数据为从通信设备上采集得到的数据,第二数据特征和第一数据特征满足第一函数关系,第二决策树和第一决策树为第三决策树变换得到的决策树。这样,通过该方法,将待检测数据变换为多个数据特征分别进行存储,并将训练获得的进行了隐私保护的决策树变换得到多个决策树,从而在检测待检测数据时能够根据变换后的决策树和变换后的数据特征分别确定检测结果,并利用多个检测结果确定能够表征待检测数据的威胁程度信息的目标检测结果,如此,实现了对威胁检测过程的各个环节的隐私保护,对待检测数据进行了更加全面的威胁检测,从而提升对用户隐私保护的安全性和可靠性。
[0007]在一种可能的实现方式中,训练决策树的过程例如可以包括:根据第一样本和初始决策树,确定第五决策树的第一梯度,第五决策树的深度比初始决策树的深度大一;根据第二样本和初始决策树,确定第六决策树的第二梯度,第六决策树的深度比初始决策树的深度大一;根据第一梯度和第二梯度,更新初始决策树,并返回执行根据第一样本和初始决策树确定第五决策树的第一梯度,以及根据第二样本和初始决策树,确定第六决策树的第二梯度,直到更新后的初始决策树满足预设条件;将满足预设条件的初始决策树确定为第四决策树。如此,能够采用联邦学习技术进行模型训练,无需发送自身的数据,避免了用户数据的泄露,提高了该模型训练的安全性;而且,由多方分别利用自身的数据进行子模型训
练,并由一方对各方训练的子模型进行安全聚合,得到共同训练出一个机器学习模型,该过程中通过联合训练方案技术不断迭代训练出后续实际检测过程中可用的第四决策树,提高了模型训练过程中样本、模型等的安全性。
[0008]作为一个示例,该实现方式中,上述根据第一样本和初始决策树,确定第五决策树的第一梯度,可以包括:根据第一样本、差分隐私算法和初始决策树,确定第五决策树;计算第五决策树的梯度,记作第一梯度。这样,在决策树训练过程中加入随机扰动,即,通过差分隐私算法避免攻击者截获模型,提高了所训练决策树的安全性。
[0009]作为另一个示例,该实现方式中,上述根据第一样本和初始决策树,确定第五决策树的第一梯度,可以包括:根据第一样本和初始决策树,确定第五决策树的第一梯度;根据第一随机掩码更新第一梯度,更新后的第一梯度的值由第一随机掩码和更新前第一梯度的值确定,其中,第一随机掩码用于抵消确定第二梯度时所使用的第二随机掩码。这样,引入掩码技术,即,在计算得到的梯度的基础上加随机掩码,通过掩码技术避免攻击者以截获的梯度推断出用户数据或模型,提高了所训练决策树的安全性。
[0010]在一种可能的实现方式中,在基于待检测数据的第一数据特征和第一决策树确定第一检测结果,以及基于待检测数据的第二数据特征和第二决策树确定第二检测结果之前,该方法还可以包括:根据隐私保护算法和第四决策树,确定第三决策树,从而,根据第三决策树,确定第一决策树和第二决策树。其中,隐私保护算法用于对第四决策树进行隐私保护,例如,隐私保护算法可以是混淆电路(英文:garbled circuit,简称:GC)算法或安全多方(英文:secure multiparty computation,简称:MPC)算法。这样,通过将训练获得的决策树进行隐私保护并将隐私保护后的决策树变换得到多个决策树,利用变换所得的多个决策树进行威胁检测,如此,提高了威胁检测过程的安全性。
[0011]作为一个示例,对于隐私保护算法为混淆电路算法的情况,该方法还可以包括:确定混淆电路、混淆电路的种子和解密信息。那么,上述基于待检测数据的第一数据特征和第一决策树确定第一检测结果,可以包括:基于第一数据特征、混淆电路的第一模型数据、混淆电路和种子,获得第一检测结果。同理,上述基于待检测数据的第二数据特征和第二决策树确定第二检测结果,可以包括:基于第二数据特征、混淆电路的第二模型数据、混淆电路和种子,获得第二检测结果,第二模型数据和第一模型数据满足第二函数关系。从而,上述根据第一检测结果和第二检测结果,确定目标检测结果,可以包括:根据第一检测结果、第二检测结果、解密信息和第三决策树,确定待检测数据的目标检测结果。可见,通过由混淆电路算法进行隐私保护的决策树对待检测数据进行威胁检测,并且将决策树进行变换得到多个决策树,使得秘密共享了数据特征的多方能够借助这多个决策树分别进行威胁检测,最终由一方整合多方的检测结果,得到表征待检测数据非法可能性大小的目标检测结果,这样,该检测阶段充分的利用了本申请实施例中各个阶段的安全设计,作为一个整体流程,使得该威胁检测流程能够更加全面和有效的抵御攻击。
[0012]作为另一个示例,对于隐私保护算法为安全多方算法的情况,该方法中基于待检测数据的第一数据特征和第一决策树确定第一检测结果,可以包括:基于第一数据特征和第一决策树上各节点对应的阈值,确定第一决策树上各节点对应的第一中间结果;根据第一决策树上各节点对应的第一中间结果和第一决策树的各个最大深度叶子节点对应的第二参数,确定第一决策树的各个最大深度叶子节点对应的第二中间结果,第二参数为第一
决策树的各个最大深度叶子节点对应的权重;根据第一决策树的各个最大深度叶子节点对应的第二中间结果,确定第一检测结果。同理,上述基于待检测数据的第二数据特征和第二决策树确定第二检测结果,可以包括:基于第二数据特征和第二决策树上各节点对应的阈值,确定第二决策树上各节点对应的第三中间结果;根据第二决策树上各节点对应的第三中间结果和第二决策树的各个最大深度叶子节点对应的第三参数,确定第二决策树的各个最大深度叶子节点对应的第四中间结果,第三参数为第二决本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种威胁检测方法,其特征在于,包括:基于待检测数据的第一数据特征和第一决策树确定第一检测结果,所述第一数据特征为从所述待检测数据中提取的数据特征,所述待检测数据为从通信设备上采集得到的数据;基于所述待检测数据的第二数据特征和第二决策树确定第二检测结果,所述第二数据特征为从所述待检测数据中提取的数据特征,所述第二数据特征和所述第一数据特征满足第一函数关系,所述第二决策树和所述第一决策树为第三决策树变换得到的决策树;根据所述第一检测结果和所述第二检测结果,确定目标检测结果,所述目标检测结果用于表征所述待检测数据的威胁程度信息。2.根据权利要求1所述的方法,其特征在于,在所述基于待检测数据的第一数据特征和第一决策树确定第一检测结果,以及所述基于所述待检测数据的第二数据特征和第二决策树确定第二检测结果之前,所述方法还包括:根据隐私保护算法和第四决策树,确定所述第三决策树,其中,所述隐私保护算法用于对所述第四决策树进行隐私保护;根据所述第三决策树,确定所述第一决策树和所述第二决策树。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:根据第一样本和初始决策树,确定第五决策树的第一梯度,所述第五决策树的深度比所述初始决策树的深度大一;根据第二样本和所述初始决策树,确定第六决策树的第二梯度,所述第六决策树的深度比所述初始决策树的深度大一;根据所述第一梯度和所述第二梯度,更新所述初始决策树,并返回执行所述根据第一样本和初始决策树确定第五决策树的第一梯度,以及所述根据第二样本和所述初始决策树,确定第六决策树的第二梯度,直到更新后的所述初始决策树满足预设条件;将满足所述预设条件的所述初始决策树确定为所述第四决策树。4.根据权利要求3所述的方法,其特征在于,所述根据第一样本和初始决策树,确定第五决策树的第一梯度,包括:根据所述第一样本、差分隐私算法和所述初始决策树,确定所述第五决策树;计算所述第五决策树的梯度,记作所述第一梯度。5.根据权利要求3或4所述的方法,其特征在于,所述根据第一样本和初始决策树,确定第五决策树的第一梯度,包括:根据所述第一样本和所述初始决策树,确定所述第五决策树的所述第一梯度;根据第一随机掩码更新所述第一梯度,更新后的所述第一梯度的值由所述第一随机掩码和更新前所述第一梯度的值确定,其中,所述第一随机掩码用于抵消确定所述第二梯度时所使用的第二随机掩码。6.根据权利要求2至5任一项所述的方法,其特征在于,所述隐私保护算法为混淆电路算法。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:确定混淆电路、所述混淆电路的种子和解密信息;所述基于待检测数据的第一数据特征和第一决策树确定第一检测结果,包括:
基于所述第一数据特征、所述混淆电路的第一模型数据、所述混淆电路和所述种子,获得所述第一检测结果;所述基于所述待检测数据的第二数据特征和第二决策树确定第二检测结果,包括:基于所述第二数据特征、所述混淆电路的第二模型数据、所述混淆电路和所述种子,获得所述第二检测结果,所述第二模型数据和所述第一模型数据满足第二函数关系;所述根据所述第一检测结果和所述第二检测结果,确定目标检测结果,包括:根据所述第一检测结果、所述第二检测结果、所述解密信息和所述第三决策树,确定所述待检测数据的目标检测结果。8.根据权利要求2至5任一项所述的方法,其特征在于,所述隐私保护算法为安全多方算法。9.根据权利要求8所述的方法,其特征在于,所述基于待检测数据的第一数据特征和第一决策树确定第一检测结果,包括:基于所述第一数据特征和所述第一决策树上各节点对应的阈值,确定所述第一决策树上各节点对应的第一中间结果;根据所述第一决策树上各节点对应的第一中间结果和所述第一决策树的各个最大深度叶子节点对应的第二参数,确定所述第一决策树的各个最大深度叶子节点对应的第二中间结果,所述第二参数为所述第一决策树的各个最大深度叶子节点对应的权重;根据所述第一决策树的各个最大深度叶子节点对应的第二中间结果,确定所述第一检测结果;所述基于所述待检测数据的第二数据特征和第二决策树确定第二检测结果,包括:基于所述第二数据特征和所述第二决策树上各节点对应的阈值,确定所述第二决策树上各节点对应的第三中间结果;根据所述第二决策树上各节点对应的第三中间结果和所述第二决策树的各个最大深度叶子节点对应的第三参数,确定所述第二决策树的各个最大深度叶子节点对应的第四中间结果,所述第三参数为所述第二决策树的各个最大深度叶子节点对应的权重;根据所述第二决策树的各个最大深度叶子节点对应的第三中间结果,确定所述第二检测结果。10.一种威胁检测装置,其特征在于,包括:第一确定单元,用于基于待检测数据的第一数据特征和第一决策树确定第一检测结果,所述第一数据特征为从所述待检测数据中提取的数据特征,所述待检测数据为从通信设备上采集得到的数据;第二确定单元,用于基于所述待检测数据的第二数据特征和第二决策树确定第二检测结果,所述第二数据特征为从所述待检测数据中提取的数据特征,所述第二数据特征和所述第一数据特征满足第一函数关系,所述第二决策树和所述第一决策树为第三决策树变换得到的决策树;第三确定单元,用于根据所述第一检测结果和所述第二检测结果,确定目标检测结果,所述目标检测结果用于表征所述待检测数据的威胁程度信息。11.根据权利要求10所述的装置,其特征在于,所述装置还包括:第四确定单元,用于在所述基于待检测数据的第一数据特征和第一决策树确定第一检
测结果,以及所述基于所述待检测数据的第二数据特征和第二决策树确定第二检测结果之前,根据隐私保护算法和第四决策树,确定所述第三决策树,其中,所述隐私保护算法用于对所述第四决策树进行隐私保护;第五确定单元,用于根据所述第三决策树,确定所述第一决策树和所述第二决策树。12.根据权利要求11所述的装置,其特征在于,所述装置还包括:第六确定单元,用于根据第一样本和初始决策树,确定第五决策树的第一梯度,所述第五决策树的深度比所述初始决策树的深度大一;第七确定单元,用于根据第二样本和所述初始决策树,确定第六决策树的第二梯度,所述第六决策树的深度比所述初始决策树的深度大一;更新单元,用于根据所述第一梯度和所述第二梯度,更新所述初始决策树,并返回执行所述根据第一样本和初始决策树确定第五决策树的第一梯度,以及所述根据第二样本和所述初始决策树,确定第六决策树的第二梯度,直到更新后的所述初始决策树满足预设条件;第八确定单元,用于将满足所述预设条件的所述初始决策树确定为所述第四决策树。13.根据权利要求12所述的装置,其特征在于,所述第六确定单元,包括:第一确定子单元,用于根据所述第一样本、差分隐私算法和所述初始决策树,确定所述第五决策树;计算子单元,用于计算所述第五决策树的梯度,记作所述第一梯度。14.根据权利要求12或13所述的装置,其特征在于,所述第六确定单元,包括:第二确定子单元,用于根据所述第一样本和所述初始决策树,确定所述第五决策树的所述第一梯度;更新子单元,用于根据第一随机掩码更新所述第一梯度,更新后的所述第一梯度的值由所述第一随机掩码和更新前所述第一梯度的值确定,其中,所述第一随机掩码用于抵消确定所述第二梯度时所使用的第二随机掩码。15.根据权利要求11至14任一项所述的装置,其...

【专利技术属性】
技术研发人员:张秉晟陈美会张心语许梦雯朱晓林
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1