基于神经网络模型的分箱方法、装置及电子设备制造方法及图纸

技术编号:33418434 阅读:29 留言:0更新日期:2022-05-19 00:11
本申请提供了一种基于神经网络模型的分箱方法、装置、电子设备及计算机可读存储介质;所述方法包括:获取神经网络模型的样本集;对样本集中的多个特征样本进行样本分箱处理,得到包括至少两个样本分箱的分箱序列;分别确定各样本分箱的证据权重(WOE,weight of evidence);基于各样本分箱的证据权重,从分箱序列中提取呈单调关系的最长单调序列,最长单调序列包括至少两个样本分箱;基于最长单调序列,对至少两个样本分箱中未处于最长单调序列的样本分箱进行合并,得到至少两个目标分箱。通过本申请,能够得到显著提升神经网络模型的鲁棒性和可解释性的分箱。鲁棒性和可解释性的分箱。鲁棒性和可解释性的分箱。

【技术实现步骤摘要】
基于神经网络模型的分箱方法、装置及电子设备


[0001]本申请涉及数据处理技术,尤其涉及一种基于神经网络模型的分箱方法、装置及电子设备。

技术介绍

[0002]分箱是一种对多个数据进行分组的技术,每个分组可以称之为一个分箱。在机器学习领域中,通过对连续型的特征进行分箱处理,可以将特征离散化,从而使得基于该离散化的特征进行模型训练时,能够加快模型的迭代,有效增强了模型的鲁棒性和可解释性。
[0003]相关技术中采用等距分箱、等频分箱等分箱方法进行数据的分箱处理,然而,采用这些分箱方式得到的分箱,无法有效提升训练得到的模型的鲁棒性和可解释性。

技术实现思路

[0004]本申请实施例提供一种基于神经网络模型的分箱方法、装置、电子设备及存储介质,能够得到显著提升神经网络模型的鲁棒性和可解释性的分箱。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供一种基于神经网络模型的分箱方法,包括:
[0007]获取神经网络模型的样本集;
[0008]对所述样本集中的多个特征样本进本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络模型的分箱方法,其特征在于,包括:获取神经网络模型的样本集;对所述样本集中的多个特征样本进行样本分箱处理,得到包括至少两个样本分箱的分箱序列;分别确定各所述样本分箱的证据权重;基于各所述样本分箱的证据权重,从所述分箱序列中提取呈单调关系的最长单调序列,所述最长单调序列包括至少两个样本分箱;基于所述最长单调序列,对所述至少两个样本分箱中未处于所述最长单调序列的样本分箱进行合并,得到至少两个目标分箱。2.根据权利要求1所述的方法,其特征在于,所述基于所述最长单调序列,对所述至少两个样本分箱中未处于所述最长单调序列的样本分箱进行合并,得到至少两个目标分箱,包括:确定所述分箱序列中未处于所述最长单调序列中的至少一个子序列,所述子序列包括至少一个样本分箱;分别将所述至少一个子序列中的样本分箱进行合并,得到至少一个合并分箱;基于所述最长单调序列,对所述至少一个合并分箱进行合并,得到至少两个目标分箱。3.根据权利要求2所述的方法,其特征在于,所述基于所述最长单调序列,对所述至少一个合并分箱进行合并,得到至少两个目标分箱,包括:针对各所述合并分箱执行以下处理:获取所述最长单调序列中与所述合并分箱相邻且证据权重差值最小的样本分箱;将所述合并分箱与所述相邻且证据权重差值最小的样本分箱进行合并,以得到所述至少两个目标分箱。4.根据权利要求2所述的方法,其特征在于,所述基于所述最长单调序列,对所述至少一个合并分箱进行合并,得到至少两个目标分箱之前,所述方法还包括:分别确定所述至少一个合并分箱的证据权重;基于所述最长单调序列中各样本分箱的证据权重和各所述合并分箱的证据权重,重新确定最长单调序列;相应的,所述基于所述最长单调序列,对所述至少一个合并分箱进行合并,得到至少两个目标分箱,包括:基于重新确定的最长单调序列,对所述至少一个合并分箱进行合并,得到至少两个目标分箱。5.根据权利要求2所述的方法,其特征在于,所述基于所述最长单调序列,对所述至少一个合并分箱进行合并,得到至少两个目标分箱,包括:分别将所述至少一个合并分箱与所述最长单调序列中的样本分箱进行合并,得到合并分箱序列,所述合并分箱序列包括至少两个合并后的样本分箱;分别确定所述合并分箱序列中的样本分箱的证据权重;基于所述合并分箱序列中样本分箱的证据权重,确定所述合并分箱序列未呈单调关系时,重新确定最长单调序列;基于重新确定的最长单调序列,对未处于重新确定的最长单调序列中的样本分箱进行
合并,得到所述至少两个目标分箱。6.根据权利要求5所述的方法,其特征在于,所述基于重新确定的最长单调序列,对未处于重新确定的最长单调序列中的样本分箱进行合并,得到所述至少两个目标分箱,包括:将未处于重新确定的最长单调序列中的样本分箱与处于重新确定的最长单调序列中的样本分箱进行合并,得到新的合并分箱序列;针对新的合并分箱序列,返回所述分别确定所述合并分箱序列中的样本分...

【专利技术属性】
技术研发人员:陈瑞钦黄启军李诗琦唐兴兴
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1