本发明专利技术公开了一种基于博弈分析的鲁棒风险识别方法,该方法基于专家经验得到风险识别模型相对于原始数据的属性的成本收益信息;根据成本收益信息构建基于属性的成本收益矩阵;基于成本收益矩阵得到混合策略均衡概率,并利用混合策略均衡概率和伯努利分布确定伯努利随机变量;利用预设算法采样伯努利随机变量以对原始数据进行处理得到处理后的数据,并利用处理后的数据对风险识别模型进行训练以得到鲁棒的风险识别模型
【技术实现步骤摘要】
一种基于博弈分析的鲁棒风险识别方法
[0001]本专利技术涉及下一代互联网应用安全
、
网络空间安全
、
人工智能安全研究
,特别是涉及一种基于博弈分析的鲁棒风险识别方法
。
技术介绍
[0002]人工智能技术的基础是优化技术(如基于梯度的随机梯度下降算法),其目的是在所选择的模型空间中搜索一个使得目标函数达到最小或最大(根据具体的任务确定)的模型,从而实现模型训练优化的目的
。
该技术一般使用反向传播算法来求取智能模型的梯度,随后使用随机梯度下降算法来改善模型
。
在这个过程中,数据信息不断进入模型,成为模型判断的信息基础
。
然而,由于单纯使用随机梯度下降算法的局限性,智能模型难以区分数据中存在的相关关系和因果关系(其中因果关系是相关关系的一部分,代表了二者存在直接的因果影响
。
除了因果关系之外,相关关系还包括了存在共同原因导致的混淆偏差以及存在共同结果导致的选择偏差,这些非因果的相关关系会导致风险识别存在不稳定性),导致我们无法克服数据收集阶段的局限性(比如仅收集单一企业产生的数据存在选择偏差,无法覆盖所面临攻击的所有细节)
。
因此,这种单纯的随机梯度下降算法会导致智能模型学习到一些非正常的相关关系,从而导致做出错误判断
。
这种非因果的相关关系正是潜在攻击者可能利用的目标
。
博弈论是分析不同行为主体之间彼此交互的数学工具,通过形式化交互的经济属性,在理性人的假设下对不同行为主体的行为进行判断,并根据预期行为作出最优的决策加以应对
。
在博弈论中,成本收益矩阵是一个基本的分析要素,由于理性人假设的存在,每个行为主体会选择收益更高的策略加以执行,这种合理的简化使得预测对手行为变得可能
。
在实践中,成本和收益可以在长期的社会实践中观察和收集,而博弈论帮助特定的行为主体将成本和收益转化为对对手行为的预期,从而客观上刻画对手的行为
。
[0003]随着互联网技术的应用和普及,国家和企业愈发频繁地接触到互联网带来的长尾效应,导致依靠人工进行风险识别的传统方法无法应对互联网时代下的海量业务数据
。
为此,国家和企业开始引入人工智能技术进行智能风险识别,如基于多层感知机技术的网络赌博风险识别
、
基于集成树模型的洗钱风险识别
。
然而,智能风险识别技术也面临着潜在的攻击挑战:潜在的攻击者可以调整自己的行为模式绕过风险识别系统,从而获取巨大的经济利益
。
这种隐藏潜在攻击的行为一方面给企业带来了风险和经济损失;另一方面也给国家的监管防护带来了难度
。
因此,如何提高识别风险的鲁棒程度成为了经济社会发展的重要组成部分
。
技术实现思路
[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一
。
[0005]本专利技术的目的是解决风险识别系统中的对抗性攻击问题
。
为此,提出了一种基于博弈分析的鲁棒风险识别方法,本专利技术借助博弈模型构建具有随机策略的模型训练方法,以训练的不确定性降低潜在攻击者的攻击收益,提高攻击成本,进而减少此类攻击的发生
。
[0006]本专利技术的另一个目的在于提出一种基于博弈分析的鲁棒风险识别装置
。
[0007]为达上述目的,本专利技术一方面提出一种基于博弈分析的鲁棒风险识别方法,包括:基于专家经验得到风险识别模型相对于原始数据的属性的成本收益信息;根据所述成本收益信息构建基于属性的成本收益矩阵;基于所述成本收益矩阵得到混合策略均衡概率,并利用所述混合策略均衡概率和伯努利分布确定伯努利随机变量;利用预设算法采样所述伯努利随机变量以对所述原始数据进行处理得到处理后的数据,并利用所述处理后的数据对所述风险识别模型进行训练以得到鲁棒的风险识别模型
。
[0008]本专利技术实施例的基于博弈分析的鲁棒风险识别方法还可以具有以下附加技术特征:在本专利技术的一个实施例中,所述成本收益信息,包括攻击所需的成本
、
攻击而模型使用属性进行训练时的收益
、
攻击而模型未使用属性进行训练时的收益
、
未攻击而模型未使用属性进行训练的收益以及未攻击而模型使用属性进行训练的收益
。
[0009]在本专利技术的一个实施例中,根据所述成本收益矩阵得到混合策略均衡概率,包括:确定属性的使用概率表达式和未使用概率表达式;根据所述使用概率表达式和未使用概率表达式构建均衡方程;求解所述均衡方程得到混合策略均衡概率,以根据所述混合策略均衡概率确定属性的使用概率
。
[0010]在本专利技术的一个实施例中,利用预设算法采样所述伯努利随机变量以对所述原始数据进行处理得到处理后的数据,包括:通过
Monte Carlo
算法对所述伯努利随机变量进行独立同分布采样以得到伯努利随机变量的采样值;利用所述采样值对所述原始数据进行数据处理以得到所述处理后的数据
。
[0011]在本专利技术的一个实施例中,在得到所述处理后的数据之后,所述方法,还包括:预设模型优化停止条件;利用所述处理后的数据进行模型训练优化,判断优化后的模型是否满足所述模型优化停止条件,若否,则继续采样数据并采用所述方法处理数据进行训练;若是,则判断所述专家经验是否更新
。
[0012]为达上述目的,本专利技术另一方面提出一种基于博弈分析的鲁棒风险识别装置,包括:成本收益信息获取模块,用于基于专家经验得到风险识别模型相对于原始数据的属性的成本收益信息;成本收益矩阵构建模块,用于根据所述成本收益信息构建基于属性的成本收益矩阵;概率计算变量确定模块,用于基于所述成本收益矩阵得到混合策略均衡概率,并利用所述混合策略均衡概率和伯努利分布确定伯努利随机变量;数据优化模型训练模块,用于利用预设算法采样所述伯努利随机变量以对所述原始数据进行处理得到处理后的数据,并利用所述处理后的数据对所述风险识别模型进行训
练以得到鲁棒的风险识别模型
。
[0013]本专利技术实施例的基于博弈分析的鲁棒风险识别方法和装置,通过对数据属性的攻击收益和成本分析,动态调节人工智能算法中的信息使用概率,以减小潜在攻击者的攻击收益,从而降低攻击成功的概率,并提供鲁棒的风险识别模型
。
同时,可以有效地限制数据收集阶段的局限性,从而利用成本收益知识增强输入与输出之间的因果联系,为鲁棒识别提供支撑
。
[0014]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到
。
附图说明
[0015]本专利技术上述的和
/
或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本专利技术实施例的基于博弈分析的鲁棒风险识别方本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于博弈分析的鲁棒风险识别方法,其特征在于,所述方法包括:基于专家经验得到风险识别模型相对于原始数据的属性的成本收益信息;根据所述成本收益信息构建基于属性的成本收益矩阵;基于所述成本收益矩阵得到混合策略均衡概率,并利用所述混合策略均衡概率和伯努利分布确定伯努利随机变量;利用预设算法采样所述伯努利随机变量以对所述原始数据进行处理得到处理后的数据,并利用所述处理后的数据对所述风险识别模型进行训练以得到鲁棒的风险识别模型
。2.
根据权利要求1所述的方法,其特征在于,所述成本收益信息,包括攻击所需的成本
、
攻击而模型使用属性进行训练时的收益
、
攻击而模型未使用属性进行训练时的收益
、
未攻击而模型未使用属性进行训练的收益以及未攻击而模型使用属性进行训练的收益
。3.
根据权利要求1所述的方法,其特征在于,根据所述成本收益矩阵得到混合策略均衡概率,包括:确定属性的使用概率表达式和未使用概率表达式;根据所述使用概率表达式和未使用概率表达式构建均衡方程;求解所述均衡方程得到混合策略均衡概率,以根据所述混合策略均衡概率确定属性的使用概率
。4.
根据权利要求3所述的方法,其特征在于,利用预设算法采样所述伯努利随机变量以对所述原始数据进行处理得到处理后的数据,包括:通过
Monte Carlo
算法对所述伯努利随机变量进行独立同分布采样以得到伯努利随机变量的采样值;利用所述采样值对所述原始数据进行数据处理以得到所述处理后的数据
。5.
根据权利要求4所述的方法,其特征在于,在得到所述处理后的数据之后,所述方法,还包括:预设模型优化停止条件;利用所述处理后的数据进行模型训练优化,判断优化后的模型是否满足所述模型优化停止条件,若否,则继续采样数据并采用所述方法处理数据进行训练;若是,则判断所述专家经验是否更新
。6.
一种基于博弈分析的鲁棒...
【专利技术属性】
技术研发人员:徐恪,谭崎,赵乙,王维强,赵闻飙,金宏,
申请(专利权)人:蚂蚁科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。