风险数据筛选方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20682415 阅读:21 留言:0更新日期:2019-03-27 19:22
本申请涉及大数据技术领域,应用于金融行业,提供了一种风险数据筛选方法、装置、计算机设备和存储介质。方法包括:根据获取的风险数据的所属数据类别,确定风险数据指标的组成风险因子,获得风险数据指标,将多个风险数据指标分别输入预设风险评估模型,获取风险评估结果差异大于设定范围的风险数据指标组合,并将风险数据指标组合对应的风险数据的比较,确定有效风险因子,对风险数据进行筛选。通过风险数据类别,确定风险数据指标的组成风险因子,对风险数据进行了初步筛选得到风险数据指标,根据多个风险数据指标的风险评估结果,确定有效风险因子,实现了对风险数据的二次筛选,进而提高了风险数据的有效性,避免无效数据干扰风险评估结果。

【技术实现步骤摘要】
风险数据筛选方法、装置、计算机设备和存储介质
本申请涉及大数据
,特别是涉及一种风险数据筛选方法、装置、计算机设备和存储介质。
技术介绍
随着企业多元化以及国际经营化的发展,越来越多的企业,对于企业自身的风险管控和预警日益看重,由于有效的风险预警有利于降低企业风险,减少利益损失。传统的风险预警方法是根据研究对象的特点,通过收集相关资料信息,监控风险信号的变化趋势,并评价各种风险状态偏离预警阈值的强弱程度,向决策层发出预警信号并提前采取对策的系统。这些方法的核心技术通常为专家规则或机器学习算法。然而,传统的机器学习算法在进行风险数据筛选时往往是依据行业经验,筛选得到的风险数据中可能存在部分无效数据,干扰风险预测结果。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高数据有效性的风险数据筛选方法、装置、计算机设备和存储介质。一种风险数据筛选方法,所述方法包括:获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子;根据所述风险数据和所述组成风险因子,获得所述风险数据指标;将多个所述风险数据指标分别输入预设风险评估模型,获取所述风险评估结果差异大于设定范围的风险数据指标组合,并获取所述风险数据指标组合中各风险数据指标对应的组成风险因子集合;比较所述组成风险因子集合对应的风险数据,根据比较结果确定有效风险因子;根据所述有效风险因子,对所述风险数据进行筛选。在其中一个实施例中,所述获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子包括:获取正样本的风险数据和负样本的风险数据,根据所述风险数据的所属数据类别,对所述风险数据进行分类;根据预设的评价参数,评价各类别的所述风险数据对于正样本和负样本的区分度;根据所述区分度评价结果,确定所述风险数据指标的组成风险因子。在其中一个实施例中,所述获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子之前,还包括:获取待处理数据,对所述待处理数据进行数据格式的归一化处理;对经过数据格式的归一化处理的所述待处理数据进行数据清洗,获得清洗数据;对所述清洗数据进行衍生计算处理,获得衍生数据;根据预设阈值范围,对所述清洗数据和所述衍生数据进行筛选,确定所述风险数据。在其中一个实施例中,所述获取待处理数据,对所述待处理数据进行数据格式的归一化处理包括:获取所述待处理数据划中的非结构化待处理数据,对所述非结构化待处理数据进行关键字提取和/或主题提取;根据提取结果,将所述非结构化待处理数据转换为结构化数据。在其中一个实施例中,所述根据预设阈值范围,对所述清洗数据和所述衍生数据进行筛选,确定所述风险数据之后,还包括:根据所述风险数据,推送所述风险数据对应的预警信息。在其中一个实施例中,所述根据所述有效风险因子,对所述风险数据进行筛选之后,还包括:根据所述有效数据类别,获取待分析企业的有效风险数据,并更新所述风险数据指标的组成风险因子;根据所述有效风险数据以及更新的所述风险数据指标的组成风险因子,确定所述待分析企业各维度的风险数据指标;获取各维度的风险数据指标携带的维度类别标签;将所述风险数据指标输入预设模型群中与所述维度类别标签对应的预设风险评估模型,获得所述风险数据指标对应的风险评估结果;根据所述各预设风险评估模型的风险评估结果,确定待分析企业的综合风险信息。在其中一个实施例中,所述将所述风险数据指标输入预设模型群中与所述维度类别标签对应的预设风险评估模型,获得所述风险数据指标对应的风险评估结果之前,还包括:获取各维度的正样本风险数据和负样本风险数据;根据所述各维度的正样本风险数据和负样本风险数据,训练得到各维度的预设风险评估模型;根据所述各维度的预设风险评估模型,构建预设模型群。一种风险数据筛选装置,所述装置包括:组成风险因子确定模块,用于获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子;风险数据指标获得模块,用于风险评估模块,用于根据所述风险数据和所述组成风险因子,获得所述风险数据指标;风险评估模块,用于将多个所述风险数据指标分别输入预设风险评估模型,获取所述风险评估结果差异大于设定范围的风险数据指标组合,并获取所述风险数据指标组合中各风险数据指标对应的组成风险因子集合;有效风险因子确定模块,用于比较所述组成风险因子集合对应的风险数据,根据比较结果确定有效风险因子;风险数据筛选模块,用于根据所述有效风险因子,对所述风险数据进行筛选。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子;根据所述风险数据和所述组成风险因子,获得所述风险数据指标;将多个所述风险数据指标分别输入预设风险评估模型,获取所述风险评估结果差异大于设定范围的风险数据指标组合,并获取所述风险数据指标组合中各风险数据指标对应的组成风险因子集合;比较所述组成风险因子集合对应的风险数据,根据比较结果确定有效风险因子;根据所述有效风险因子,对所述风险数据进行筛选。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子;根据所述风险数据和所述组成风险因子,获得所述风险数据指标;将多个所述风险数据指标分别输入预设风险评估模型,获取所述风险评估结果差异大于设定范围的风险数据指标组合,并获取所述风险数据指标组合中各风险数据指标对应的组成风险因子集合;比较所述组成风险因子集合对应的风险数据,根据比较结果确定有效风险因子;根据所述有效风险因子,对所述风险数据进行筛选。上述风险数据筛选方法、装置、计算机设备和存储介质,通过风险数据的所属数据类别,来确定风险数据指标的组成风险因子,获得风险数据指标,将多个风险数据指标分别输入预设风险评估模型,得到风险评估结果差异大于设定范围的风险数据指标组合,并获取风险数据指标组合中各风险数据指标对应的组成风险因子集合,根据组成风险因子集合对应的风险数据的差异性,确定有效风险因子,从而对风险数据进行筛选。本方案通过风险数据类别,确定用于输入预设风险评估模型的风险数据指标的组成风险因子,对风险数据进行了初步筛选得到风险数据指标,将多个风险数据指标输入预设风险评估模型,根据评估结果,确定有效风险因子,实现了对风险数据的二次筛选,从而提高了用于评估风险情况的风险数据的有效性,避免无效数据干扰风险评估结果。附图说明图1为一个实施例中风险数据筛选方法的应用场景图;图2为另一个实施例中风险数据筛选方法的流程示意图;图3为另一个实施例中风险数据筛选步骤的流程示意图;图4为另一个实施例中风险数据筛选方法的流程示意图;图5为一个实施例中风险数据筛选装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的风险数据筛选方法,用于应本文档来自技高网...

【技术保护点】
1.一种风险数据筛选方法,所述方法包括:获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子;根据所述风险数据和所述组成风险因子,获得所述风险数据指标;将多个所述风险数据指标分别输入预设风险评估模型,获取所述风险评估结果差异大于设定范围的风险数据指标组合,并获取所述风险数据指标组合中各风险数据指标对应的组成风险因子集合;比较所述组成风险因子集合对应的风险数据,根据比较结果确定有效风险因子;根据所述有效风险因子,对所述风险数据进行筛选。

【技术特征摘要】
1.一种风险数据筛选方法,所述方法包括:获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子;根据所述风险数据和所述组成风险因子,获得所述风险数据指标;将多个所述风险数据指标分别输入预设风险评估模型,获取所述风险评估结果差异大于设定范围的风险数据指标组合,并获取所述风险数据指标组合中各风险数据指标对应的组成风险因子集合;比较所述组成风险因子集合对应的风险数据,根据比较结果确定有效风险因子;根据所述有效风险因子,对所述风险数据进行筛选。2.根据权利要求1所述的方法,其特征在于,所述获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子包括:获取正样本的风险数据和负样本的风险数据,根据所述风险数据的所属数据类别,对所述风险数据进行分类;根据预设的评价参数,评价各类别的所述风险数据对于正样本和负样本的区分度;根据所述区分度评价结果,确定所述风险数据指标的组成风险因子。3.根据权利要求1所述的方法,其特征在于,所述获取待筛选的风险数据,根据所述风险数据的所属数据类别,确定风险数据指标的组成风险因子之前,还包括:获取待处理数据,对所述待处理数据进行数据格式的归一化处理;对经过数据格式的归一化处理的所述待处理数据进行数据清洗,获得清洗数据;对所述清洗数据进行衍生计算处理,获得衍生数据;根据预设阈值范围,对所述清洗数据和所述衍生数据进行筛选,确定所述风险数据。4.根据权利要求3所述的方法,其特征在于,所述获取待处理数据,对所述待处理数据进行数据格式的归一化处理包括:获取所述待处理数据划中的非结构化待处理数据,对所述非结构化待处理数据进行关键字提取和/或主题提取;根据提取结果,将所述非结构化待处理数据转换为结构化数据。5.根据权利要求3所述的方法,其特征在于,所述根据预设阈值范围,对所述清洗数据和所述衍生数据进行筛选,确定所述风险数据之后,还包括:根据所述风险数据,推送所述风险数据对应的预警信息。6.根据权利要求1所述的方法,其特征在于,所述根据所述有...

【专利技术属性】
技术研发人员:张翔周欣欣汪伟肖京高舒
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1