【技术实现步骤摘要】
本专利技术实施例涉及人工智能,尤其涉及一种样本构建、风险预测方法、装置、设备、介质及产品。
技术介绍
1、在金融业务的各个领域都可能发生违规事件,严重影响金融市场秩序和金融安全。
2、违规事件包括金融从业人员操作不当导致的风险事件等。目前,可以通过逻辑回归模型基于金融机构从业人员对应的数据,计算各金融从业人员发生各类操作风险事件的概率。然而,逻辑回归模型是基于操作风险点清单和金融从业人员数据训练的机器学习模型,由于实际场景中违规事件的发生频次比较低,导致训练逻辑回归模型的训练样本集中正样本数量远远大于负样本数量,导致训练样本不均衡,进而,影响逻辑回归模型对违规事件的预测性能,导致预测准确度较低。
技术实现思路
1、本专利技术实施例提供一种样本构建、风险预测方法、装置、设备、介质及产品,可以改善正负样本数量不平衡的问题,优化模型预测性能、提升预测准确度。
2、第一方面,本专利技术实施例提供了一种样本构建方法,包括:
3、获取目标对象对应的历史数据,根据所述
...【技术保护点】
1.一种样本构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取目标对象对应的历史数据,根据所述历史数据确定正样本和原始负样本,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述原始负样本的数量确定聚类中心数量序列,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述聚类中心数量序列中的聚类中心数量确定目标函数值集合,包括:
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据聚类中心数量与目标函数值确定目标曲线,根据所述目标曲线确定目标聚类中心数量,包括:
...【技术特征摘要】
1.一种样本构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取目标对象对应的历史数据,根据所述历史数据确定正样本和原始负样本,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述原始负样本的数量确定聚类中心数量序列,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述聚类中心数量序列中的聚类中心数量确定目标函数值集合,包括:
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据聚类中心数量与目标函数值确定目标曲线,根据所述目标曲线确定目标聚类中心数量,包括:
6.根据权利要求4所述的方法,其特征在于,所述根据所述目标聚类中心数量计算目标聚类中心集合,根据所述目标聚类中心集合对所述原始负样本进行聚类得到聚类簇集,包括:
7.根据权利要求1所述的方法,其特征在于,所述根据各聚类簇中的原始负样本与目标聚类中心生成目标负样本,根据所述正样本和目标负样本构成训练样本集,包括:
8.一种风险预测方法,其特征在于,包括:
9.根据权利要求8所述的方法,其特征在于,所述风险预测模型包括第一预测模型和第二预测模型,所述第一预测模型为关注降低偏差的机器学习模型,所述第二...
【专利技术属性】
技术研发人员:陈俊俊,苏艺强,薛飞,张振强,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。