System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 账号筛选方法和装置、存储介质及电子装置制造方法及图纸_技高网

账号筛选方法和装置、存储介质及电子装置制造方法及图纸

技术编号:40036054 阅读:4 留言:0更新日期:2024-01-16 18:59
本申请公开了一种账号筛选方法和装置、存储介质及电子装置,该方法包括:在初始样本集中确定训练样本集、验证样本集和初始候选特征集;使用训练样本集、初始候选特征集拟合决策树模型,并基于拟合的目标决策树模型对验证样本集的划分结果对目标决策树模型进行评估;在划分结果满足第一预设条件时,将目标决策树模型中的目标节点所对应的条件确定为目标筛选条件以判断输入的账号是否是预设类型的账号,并使用训练样本集和验证样本集中满足目标筛选条件的样本,以及初始候选特征集拟合新的决策树模型;在划分结果不满足第一预设条件时,从初始候选特征集中剔除与目标决策树模型对应的账号特征,并使用新的特征集和训练样本集拟合新的决策树模型。

【技术实现步骤摘要】

本申请涉及机器学习领域,具体而言,涉及一种账号筛选方法和装置、存储介质及电子装置


技术介绍

1、为了提高风险管控能力,需要提前预测可能存在风险(如,逾期风险)的账号,并基于预测的结果制定相应的风险控制策略。现有技术中,对可能存在风险的账号进行的预测,通常是基于机器学习的方式,从训练数据中学习出一组能用于对账号数据进行判别的判断条件。再基于该判断条件,确定每个账号是否属于存在风险的账号。

2、然而,现有技术中在生成判断条件时,主要依靠序贯覆盖算法,在数据样本集上每学到一条判断条件,就将该判断条件覆盖的数据样本去除,再以剩下的数据样本组成新的数据样本重复上述训练学习的过程,容易出现局部最优或过拟合的问题,从而导致生成的判断条件的质量较低,进而影响对账号的判断准确性。

3、由此可见,相关技术中的账号筛选方法,存在对账号所属类型的判断准确性较低的问题。


技术实现思路

1、本申请实施例提供了一种账号筛选方法和装置、存储介质及电子装置,以至少解决相关技术中的账号筛选方法存在对账号所属类型的判断准确性较低的问题。

2、根据本申请实施例的一个方面,提供了一种账号筛选方法,包括:在获取到的初始样本集中确定训练样本集、验证样本集和初始候选特征集,其中,所述初始样本集包括n个账号中的每个账号的m个账号特征,得到n组账号特征,n和m是大于或等于2的正整数,所述训练样本集包括所述n个账号中的n1个账号中的每个账号的m个账号特征,所述验证样本集包括所述n个账号中的n2个账号中的每个账号的m个账号特征,n1是大于或等于1、且小于或等于n的正整数,n2是大于或等于1、且小于或等于n的正整数,所述初始候选特征集包括所述m个账号特征中的m个账号特征;使用所述训练样本集、所述初始候选特征集拟合决策树模型,并基于拟合得到的目标决策树模型对所述验证样本集的目标划分结果对所述目标决策树模型进行评估,得到评估结果,其中,所述目标决策树模型用于根据所述初始候选特征集中的至少部分账号特征对应的筛选条件判断输入的账号是否是预设类型的账号;在所述评估结果指示所述目标划分结果满足第一预设条件的情况下,将所述目标决策树模型中的目标节点所对应的条件确定为目标筛选条件,以判断输入的账号是否是所述预设类型的账号,并使用所述训练样本集中满足所述目标筛选条件的样本,所述验证样本集中满足所述目标筛选条件的样本,以及所述初始候选特征集拟合新的决策树模型;在所述评估结果指示所述目标划分结果不满足第一预设条件的情况下,从所述初始候选特征集中剔除与所述目标决策树模型对应的账号特征,得到新的候选特征集,并使用新的特征集和所述训练样本集拟合新的决策树模型。

3、根据本申请实施例的另一个方面,还提供了一种账号筛选装置,包括:第一确定单元,用于在获取到的初始样本集中确定训练样本集、验证样本集和初始候选特征集,其中,所述初始样本集包括n个账号中的每个账号的m个账号特征,得到n组账号特征,n和m是大于或等于2的正整数,所述训练样本集包括所述n个账号中的n1个账号中的每个账号的m个账号特征,所述验证样本集包括所述n个账号中的n2个账号中的每个账号的m个账号特征,n1是大于或等于1、且小于或等于n的正整数,n2是大于或等于1、且小于或等于n的正整数,所述初始候选特征集包括所述m个账号特征中的m个账号特征;第一执行单元,用于使用所述训练样本集、所述初始候选特征集拟合决策树模型,并基于拟合得到的目标决策树模型对所述验证样本集的目标划分结果对所述目标决策树模型进行评估,得到评估结果,其中,所述目标决策树模型用于根据所述初始候选特征集中的至少部分账号特征对应的筛选条件判断输入的账号是否是预设类型的账号;第二确定单元,用于在所述评估结果指示所述目标划分结果满足第一预设条件的情况下,将所述目标决策树模型中的目标节点所对应的条件确定为目标筛选条件,以判断输入的账号是否是所述预设类型的账号,并使用所述训练样本集中满足所述目标筛选条件的样本,所述验证样本集中满足所述目标筛选条件的样本,以及所述初始候选特征集拟合新的决策树模型;第二执行单元,用于在所述评估结果指示所述目标划分结果不满足第一预设条件的情况下,从所述初始候选特征集中剔除与所述目标决策树模型对应的账号特征,得到新的候选特征集,并使用新的特征集和所述训练样本集拟合新的决策树模型。

4、根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述账号筛选方法。

5、根据本申请实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的账号筛选方法。

6、在本申请实施例中,采用双层迭代以确定用于判断账号所属类型的筛选条件的方式,先遍历样本数据以确定初始特征,再基于初始特征和样本数据拟合出的决策树确定筛选条件以及失效特征,在剔除失效特征或者确定出一个筛选条件的基础上,利用更新后的特征或者更新后的样本数据再次拟合决策树,无论是拟合决策树,还是确定初始特征,都可以迭代进行,可以有效避免单层迭代所确定筛选条件易陷入局部最优或过拟合的问题,从而达到提高对账号所属类型的判断准确性的技术效果,进而解决了相关技术中的账号筛选方法存在对账号所属类型的判断准确性较低的问题。

本文档来自技高网...

【技术保护点】

1.一种账号筛选方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述在获取到的初始样本集中确定训练样本集、验证样本集和初始候选特征集,包括:

3.根据权利要求1所述的方法,其特征在于,所述使用所述训练样本集、所述初始候选特征集拟合决策树模型,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述验证样本集通过拟合得到的目标决策树模型所得到的目标划分结果对所述目标决策树模型进行评估,得到评估结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述目标决策树模型属于二分决策树模型,所述将所述目标决策树模型中的目标节点所对应的条件确定为目标筛选条件,以判断输入的账号是否是所述预设类型的账号,包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,在所述在满足以下之一的第一预设条件下,停止拟合决策树模型之后,所述方法还包括:

8.一种账号筛选装置,其特征在于,包括:

9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7中任一项所述的方法。

10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。

...

【技术特征摘要】

1.一种账号筛选方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述在获取到的初始样本集中确定训练样本集、验证样本集和初始候选特征集,包括:

3.根据权利要求1所述的方法,其特征在于,所述使用所述训练样本集、所述初始候选特征集拟合决策树模型,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述验证样本集通过拟合得到的目标决策树模型所得到的目标划分结果对所述目标决策树模型进行评估,得到评估结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述目标决策树模型属于二分决策树模型,所述将所述目标决策树模型中的目标节点所对应的条件确定为目标筛选条件,以...

【专利技术属性】
技术研发人员:王帅
申请(专利权)人:兴业消费金融股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1