【技术实现步骤摘要】
数据处理模型训练方法、数据处理方法、装置、电子设备
本专利技术涉及神经网络模型中的数据处理技术,尤其涉及一种数据处理模型训练方法、数据处理方法、装置、电子设备及存储介质。
技术介绍
基于机器学习的神经网络模型可以进行各类别识别,实现对不同应用场景下的数据处理。例如,在图像、自然语言处理、风险预警等应用场景中,对大量数据所实现的大规模分类和识别,以此来快速准确的获得相关的分类预测结果,加速所在应用场景的功能实现。例如在支付、借贷、理财等金融业务环节中的风险控制中,不同客户群体的数据分布差异大,并且存在众多具有小样本特性的客户群体。因此,往往难以收集足够的标记样本以供传统机器学习从数据中提取风控相关的模式特征,从而容易出现模型过拟合现象,还容易引入新的噪声,影响模型的数据处理效果。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据处理模型训练方法、数据处理方法、装置、电子设备及存储介质,能够实现通过数据处理模型中的指导网络训练参数生成网络,使得经过训练的数据处理模型能够处理小样本数据,兼顾了训练精确性的同 ...
【技术保护点】
1.一种数据处理模型训练方法,其特征在于,所述方法包括:/n确定与数据处理模型的使用环境相匹配的动态噪声阈值;/n根据所述动态噪声阈值对基类数据样本集合进行去噪处理,以形成与所述动态噪声阈值相匹配的基类数据样本集合;/n获取与所述动态噪声阈值相匹配的基类数据样本集合,并通过特征提取网络对所述基类数据样本集合的特征进行提取,其中,所述基类数据样本集合包括不同金融业务场景中的不同用户所分别对应的个人信息特征、风控模式特征、信用风险类别特征、以及相匹配的训练任务标签;/n通过所述数据处理模型中的指导网络对所提取的所述基类数据样本集合的特征进行处理,以确定所述指导网络的参数;/n通 ...
【技术特征摘要】
1.一种数据处理模型训练方法,其特征在于,所述方法包括:
确定与数据处理模型的使用环境相匹配的动态噪声阈值;
根据所述动态噪声阈值对基类数据样本集合进行去噪处理,以形成与所述动态噪声阈值相匹配的基类数据样本集合;
获取与所述动态噪声阈值相匹配的基类数据样本集合,并通过特征提取网络对所述基类数据样本集合的特征进行提取,其中,所述基类数据样本集合包括不同金融业务场景中的不同用户所分别对应的个人信息特征、风控模式特征、信用风险类别特征、以及相匹配的训练任务标签;
通过所述数据处理模型中的指导网络对所提取的所述基类数据样本集合的特征进行处理,以确定所述指导网络的参数;
通过所述数据处理模型中的参数生成网络对所提取的所述基类数据样本集合的特征进行处理,以确定所述参数生成网络的初始参数;
通过所述指导网络的输出结果和所述基类数据样本集合对所述数据处理模型中的参数生成网络的初始参数进行迭代更新,以实现通过所述数据处理模型对相应金融业务场景中的目标对象进行风险预测,并输出对应的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定与数据处理模型相对应的固定噪声阈值,并根据所述固定噪声阈值对所述基类数据样本集合进行去噪处理,以形成与所述固定噪声阈值相匹配的基类数据样本集合。
3.根据权利要求1所述的方法,其特征在于,所述通过所述数据处理模型中的指导网络对所提取的所述基类数据样本集合的特征进行处理,以确定所述指导网络的参数,包括:
将所述基类数据样本集合中的中不同训练样本,代入由所述指导网络的自编码子网络对应的损失函数;
对所述指导网络的分类层参数进行迭代更新,直至所述指导网络的自编码子网络对应的损失函数满足对应的收敛条件时,确定所述指导网络的参数。
4.根据权利要求1所述的方法,其特征在于,所述通过所述数据处理模型中的参数生成网络对所提取的所述基类数据样本集合的特征进行处理,以确定所述参数生成网络的初始参数,包括:
通过所述特征提取网络对所提取的所述基类数据样本集合的样本进行空间特征变换,确定第一特征向量;
通过所述参数生成网络中的任务表示编码器子网络,对所述第一特征向量进行处理,形成相对应的第二特征向量;
通过参数生成子网络基于所述第二特征向量,确定所述参数生成网络的分类层参数;
对所述参数生成网络的分类层参数进行迭代处理,确定所述参数生成网络的初始参数。
5.根据权利要求4所述的方法,其特征在于,所述通过所述指导网络的输出结果和所述基类数据样本集合对所述数据处理模型中的参数生成网络的初始参数进行迭代更新,以实现通过所述数据处理模型对相应金融业务场景中的目标对象进行风险预测,包括:
基于所述指导网络的分类器对应的分类层网络参数确定每一个任务类别所分别对相应的参数向量;
通过所述特征提取网络对所述每一个任务类别所分别对相应的参数向量进行处理,形成第三特征向量;
通过所述指导网络对所述第三特征向量进行处理,得到第一预测结果;
通过所述参数生成网络对所述第三特征向量进行处理,得到第二预测结果;
将所述第一预测结果和所述第二预测结果代入与所述参数生成网络对应的元损失函数,
对所述参数生成网络对应的元损失函数进行迭代更新,直至所述参数生成网络对应的元损失函数满足对应的收敛条件时,确定所述参数生成网络的参数,以实现基于所述参数生成网络的参数,利用所述数据处理模型对相应金融业务场景中的目标对象进行风险预测。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
确定所述第三特征向量在所述参数生成网络中的预测值与对应的多分类标签的交叉熵损失;
确定第三特征向量在所述参数生成网络中的预测值与所述指导网络的预测值作为软标签的交叉损失;
确定所述第三特征向量的正态分布特征以及参数的正则化约束;
基于所述交叉熵损失、交叉损失所述第三特征向量的正态分布特征以及参数的正则化约束,确定所述参数生成网络对应的元损失函数。
7.一种数据...
【专利技术属性】
技术研发人员:郭清宇,蓝利君,李超,王翔,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。