【技术实现步骤摘要】
基于多模态与深度神经网络的风控建模系统及方法
[0001]本专利技术涉及数据处理
,具体涉及基于多模态与深度神经网络的风控建模系统及方法。
技术介绍
[0002]一)传统风控建模方法
[0003]传统风控建模方法仅使用有限的结构化数据,即提过解析人行报告等结构化数据源进行数据处理与变量加工,输入模型进行训练,但单一的结构化数据源存在数据遗漏问题,利用有限信息进行风控模型的训练与预测,损失了潜在的非结构化数据(信息),进而降低风险识别的准确率,影响风险防控的效果,与此同时,传统风控策略仿真方法使用的统计模型效果普遍低于机器学习和深度学习模型。
[0004]二)机器学习风控建模方法
[0005]为了解决上述传统风控策略仿真方法的缺点,业界提出了基于机器学习的风控建模方法与系统,该方法升级到了机器学习模型架构,并引入图片或者文本这种非结构化数据,通过人为的特征构造和onehot等方式解析非结构化数据,将其解析为结构化数据联合建模,可以提高风控模型的训练和预测效果,缺点是人为构造特征存在主观性和局限性, ...
【技术保护点】
【技术特征摘要】
1.基于多模态与深度神经网络的风控建模系统,其特征在于,包括图片数据解析系统、文本数据解析系统、关系网络数据解析系统和多模态建模系统;所述图片数据解析系统用于对图片数据进行处理解析输出结构化字段P1;所述文本数据解析系统用于对文本数据进行处理解析输出结构化字段P2;所述关系网络数据解析系统对关系网络数据进行处理解析输出结构化字段P3;所述多模态建模系统用于将P1、P2和P3融合处理并训练获取最终的多模态融合模型。2.根据权利要求1所述的基于多模态与深度神经网络的风控建模系统,其特征在于,所述图片数据解析系统包括图片数据预处理模块、神经网络训练模块和图片数据解析模块。3.根据权利要求2所述的基于多模态与深度神经网络的风控建模系统,其特征在于,所述图片数据预处理模块用于对导入的图片数据预处理,将图片数据处理为标准三通道矩阵,再拼接信用风险标签构造图片数据集D1;其中所述预处理包括裁切和Resize;所述神经网络模型训练模块用于加载预处理之后的图片数据集D1来训练深度卷积神经网络模型,而后将模型保存为M1;所述图片数据解析模块用于结合图片数据解析模型M1对图片数据进行结构化解析,输出结构化字段P1。4.根据权利要求1所述的基于多模态与深度神经网络的风控建模系统,其特征在于,所述文本数据解析系统包括文本数据预处理模块、神经网络模型训练模块和文本数据解析模块。5.根据权利要求4所述的基于多模态与深度神经网络的风控建模系统,其特征在于,所述文本数据预处理模块用于将导入的文本数据进行数据清洗和拼接再拼接信用风险标签,构造文本数据集D2;所述神经网络模型训练模块用于加载预处理之后的文本数据集D1来训练Transformer模型,而后将模型保存为M2;所述文本数据解析模块用于结合文本数据解析模型M2对文本数据进行结构化解析,输出结构化字段P2。6.根据权利要求1所述的基于...
【专利技术属性】
技术研发人员:毛正冉,卫浩,刘嵩,
申请(专利权)人:四川新网银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。