神经网络评价方法及装置、电子设备、存储介质制造方法及图纸

技术编号:28943497 阅读:25 留言:0更新日期:2021-06-18 21:52
本发明专利技术提供了一种神经网络评价方法及装置、电子设备、存储介质,所述方法包括:采集每一用户的第一应用场景下的多个特征数据;对多个特征数据进行过滤,对过滤后的特征数据进行一位有效编码处理;将一位有效编码的特征数据进行embedding向量化处理,转换为相应维度的特征向量;将特征向量输入到DNN中,梯度更新DNN中各节点的参数,并预测得到每一用户的第一应用场景下的评价结果;对特征向量进行MixUp处理,扩增到设定倍数,得到扩增特征向量;将扩增特征向量输入到参数更新的DNN中,通过反向传播的训练方式再次梯度更新DNN各节点的参数,对每一用户进行评分排名。本发明专利技术能够对用户进行更客观的评价。

【技术实现步骤摘要】
神经网络评价方法及装置、电子设备、存储介质
本专利技术涉及用户在某领域的特定行为评价技术,尤其涉及一种神经网络评价方法及装置、电子设备、存储介质。
技术介绍
近年来随着对人工智能(AI,ArtificialIntelligence)等领域探索的不断加深,无论是互联网行业、传统行业、还是金融行业,都在不断寻找行之有效的模型与方法,更加深入有效的挖掘数据价值,获取最大收益与回报。以信贷场景的应用为例,目前使用的信贷准入模型主要是评分卡模型,根据用户在申请信贷时填入的个人信息,基于逻辑回归(LR,LogisticRegression)模型,通过拟合模型特征的重要性关系,删除部分特征,其余特征与对应评价分数相乘从而最终得到整体的综合得分。不同的申请人具有相应的评分,利用用户的评分对申请人的违约风险进行评估。LR模型虽然具有较佳的鲁棒性与可解释性,但局限性也十分明显:只关注于变量自身的特点,而未考虑到特征间的关系,不可避免的造成信息损失。机器学习模型的训练,需要大量的标签数据才能发挥机器学习模型的效果,而金融领域由于数据资产管理水平不足、信息采集本文档来自技高网...

【技术保护点】
1.一种神经网络评价方法,其特征在于,所述方法包括:/n采集每一用户的第一应用场景下的多个特征数据;/n对所述每一用户的多个特征数据进行过滤,对过滤后的特征数据,基于每一用户进行一位有效编码处理;/n将一位有效编码的特征数据进行嵌入embedding向量化处理,将一位有效编码的特征数据转换为相应维度的特征向量;/n将所述特征向量输入到深度神经网络DNN中,通过反向传播的训练方式,梯度更新DNN中各节点的参数,并预测得到每一用户的第一应用场景下的评价结果;/n对所述特征向量进行混类增强MixUp处理,使所述特征向量扩增到设定倍数,得到扩增特征向量;/n将所述扩增特征向量输入到参数更新的DNN中,...

【技术特征摘要】
1.一种神经网络评价方法,其特征在于,所述方法包括:
采集每一用户的第一应用场景下的多个特征数据;
对所述每一用户的多个特征数据进行过滤,对过滤后的特征数据,基于每一用户进行一位有效编码处理;
将一位有效编码的特征数据进行嵌入embedding向量化处理,将一位有效编码的特征数据转换为相应维度的特征向量;
将所述特征向量输入到深度神经网络DNN中,通过反向传播的训练方式,梯度更新DNN中各节点的参数,并预测得到每一用户的第一应用场景下的评价结果;
对所述特征向量进行混类增强MixUp处理,使所述特征向量扩增到设定倍数,得到扩增特征向量;
将所述扩增特征向量输入到参数更新的DNN中,通过反向传播的训练方式再次梯度更新DNN各节点的参数,以对预测的每一用户的第一应用场景下的评价结果进行调整,以调整后的评价结果对每一用户进行评分排名。


2.根据权利要求1所述的方法,其特征在于,所述对所述每一用户的多个特征数据进行过滤,包括:
至少识别所述多个特征数据中的无效数据以及用户的特征数据缺失超出设定数量的缺失数据,删除所述无效数据和所述缺失数据;
对剩余的存在空值的特征数据进行特征值填充,将数值型特征数据进行归一化处理。


3.根据权利要求1或2所述的方法,其特征在于,所述对所述特征向量进行混类增强MixUp处理,包括:
若batchxi是所述特征向量中的第一数据,batchyi是所述第一数据对应的标签;batchxj是所述特征向量中的第二数据,batchyj是所述第二数据对应的标签,λ是由参数为α、β的贝塔分布计算出来的混合系数,则通过下式对所述特征向量进行MixUp处理:
λ=Beta(α,β);
mixed_batchx=λ∗batchxi+(1−λ)∗batchxj;
mixed_batchy=λ∗batchyi+(1−λ)∗batchyj;
其中,Beta()表示贝塔分布运算,λ∈[0,1],mixed_batchx表示混合后的特征向量中的第三数据,mixed_batchy表示所述第三数据对应的标签。


4.根据权利要求3所述的方法,其特征在于,在对所述特征向量进行MixUp处理之前,所述方法还包括:
将所述特征向量中的标签的顺序打乱。


5.根据权利要求3所述的方法,其特征在于,所述α、β均取值为0.5。


6.一种神经网络评价装置,其特征在于,所述装置包括:
采集单元,用于采集每一用户的第一应用场景下的多个特征数据;
编码处理单元,用于对所述每一用户的多个特征数据进行过滤,对过滤后的特征数据,基于每一用户进行一位有效编码处理;
向量化处理单...

【专利技术属性】
技术研发人员:刘博文郭晓雯李晨阳蔡准孙悦郭晓鹏
申请(专利权)人:北京芯盾时代科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1