基于重复抽样与压力测试的模型稳健性检测方法技术

技术编号:24331431 阅读:59 留言:0更新日期:2020-05-29 19:45
本申请公开了基于重复抽样与压力测试的模型稳健性检测方法,通过获取符合目标对象识别模型的样本对象,根据所述样本对象的行为数据在特定时间条件下是否符合条件,对所述样本对象进行划分及分层抽样,构成初始样本集;按照设定的配比对所述初始样本集进行有放回的抽取,生成测试样本集;根据预设的计算方式对所述测试样本集进行运算,得到验证参数,计算所述验证参数的统计变量;获取用户的需求信息,根据所述统计变量判断所述目标对象识别模型是否满足所述需求信息;若是,则输出所述目标对象识别模型,通过所述目标对象识别模型识别目标对象。应用本申请的技术方案,实现在各种样本配比的情况下,保证模型的稳健性,进而保证目标识别的准确性。

Model robustness testing method based on repeated sampling and stress testing

【技术实现步骤摘要】
基于重复抽样与压力测试的模型稳健性检测方法
本申请涉及计算机
,特别是指基于重复抽样与压力测试的模型稳健性检测方法。
技术介绍
现代社会中,基于特定的目的,用户会设计特定的模型对目标进行识别,辨别目标是否符合特定的需求或要求。例如:在人物识别时,用户可能会希望识别出未来有可能违法的人物,进而需要建立特定的模型对人物进行识别,获取人物的违法记录及违法频率等,从而得出人物违法概率等因素,进而实现人物识别,确定关注对象;或是在企业贷款或授信时,用户可能会希望识别出未来有可能逾期或违约的企业,进而需要建立特定的模型对企业进行识别等等。而模型的稳定对所建立的模型来说具有非常重要的意义,在模型不具有稳健性的条件下,其虽然仍可进行模型运算,但输出结果可能会掩盖真实的变量间的关系,从而扭曲结果,使模型参数的估计失去了准确性。基于模型输出结果对事物的指导就可能偏离实际,甚至带来损失。模型稳健性检测的研究是建立优质模型的必要环节,是模型具备泛化能力的前提。传统的模型稳健性检测方法,相关参数计算时,依据的样本较少,不能验证模型在不同样本配比情况下的极端表现,模本文档来自技高网...

【技术保护点】
1.基于重复抽样与压力测试的模型稳健性检测方法,其特征在于,包括:/n获取符合目标对象识别模型的样本对象,根据所述样本对象的行为数据在特定时间条件下是否符合条件,对所述样本对象进行划分及分层抽样,构成初始样本集;/n按照设定的配比对所述初始样本集进行有放回的抽取,生成测试样本集;/n根据预设的计算方式对所述测试样本集进行运算,得到验证参数,计算所述验证参数的统计变量;/n获取用户的需求信息,根据所述统计变量判断所述目标对象识别模型是否满足所述需求信息;/n若是,则输出所述目标对象识别模型,通过所述目标对象识别模型识别目标对象。/n

【技术特征摘要】
1.基于重复抽样与压力测试的模型稳健性检测方法,其特征在于,包括:
获取符合目标对象识别模型的样本对象,根据所述样本对象的行为数据在特定时间条件下是否符合条件,对所述样本对象进行划分及分层抽样,构成初始样本集;
按照设定的配比对所述初始样本集进行有放回的抽取,生成测试样本集;
根据预设的计算方式对所述测试样本集进行运算,得到验证参数,计算所述验证参数的统计变量;
获取用户的需求信息,根据所述统计变量判断所述目标对象识别模型是否满足所述需求信息;
若是,则输出所述目标对象识别模型,通过所述目标对象识别模型识别目标对象。


2.根据权利要求1所述的方法,其特征在于,所述按照设定的配比对所述初始样本集进行有放回的抽取,具体包括:
设置包括至少一种所述配比的配比集;
根据所述配比集中的每一种所述配比,分别对所述初始样本集进行有放回的抽取。

【专利技术属性】
技术研发人员:吉风明焦宇微
申请(专利权)人:东方微银科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1