【技术实现步骤摘要】
相似样本的确定方法与授信额度的确定方法
[0001]本申请涉及数据处理
,特别是涉及一种相似样本的确定装置、计算机设备、存储介质和计算机程序产品,另外还涉及一种授信额度的确定方法装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]金融行业中各企业可以对客户提供贷款服务,在贷款过程中,金融企业会对客户的信息进行综合评估,从而确定该客户的可贷款的额度,即授信额度,没有授信额度的客户称为无授信额度客户。金融企业在确定无授信额度客户的授信额度时,主要根据无授信额度客户的信息在行内已存客户中查找最相似的客户,根据最相似客户的授信额度确定无授信额度客户的授信额度。通常采用无授信额度客户分别与行内已存客户计算相似度方式,确定与无授信额度客户最相似的客户,因行内已存客户的数量比较大,导致计算量大。
[0003]目前,金融企业为了减少计算量,通常减少计算特征,或者仅采用部分样本进行计算,这些方式确定相似样本的准确度不高。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高无 ...
【技术保护点】
【技术特征摘要】
1.一种相似样本的确定方法,其特征在于,所述方法包括:获取待分析的样本集和无授信额度客户的客户信息;以预设多个特征依次对所述待分析的样本集进行分类,获得多个样本子集,并将所述多个样本子集以所述预设多个特征为交叉节点构成样本二叉树;根据所述客户信息从所述样本二叉树中查找到与所述客户信息相似的目标样本子集;获取所述目标样本子集中各样本分别与所述无授信额度客户的相似度,并将所述相似度超过预设阈值的样本作为所述无授信额度客户的相似样本。2.根据权利要求1所述的方法,其特征在于,所述以预设多个特征依次对所述待分析的样本集进行分类获得多个样本子集包括:以预设多个特征中第一特征对所述待分析的样本集进行分类,获得第一样本子集和第二样本子集;以预设多个特征中第二特征对第一样本子集进行分类,获得第三样本子集和第四样本子集,并以预设多个特征中第二特征对第二样本子集进行分类,获得第五样本子集和第六样本子集,依次类推,直到预设多个特征均对所述待分析的样本集进行分类,获得到所述多个样本子集。3.根据权利要求2所述的方法,其特征在于,所述预设多个特征包括:基础信息、行内资产、对公流水、对私流水、税务和代发工资中的至少两个特征。4.根据权利要求1所述的方法,其特征在于,所述以预设多个特征依次对所述待分析的样本集进行分类,获得多个样本子集,并将所述多个样本子集以所述预设多个特征为交叉节点构成样本二叉树之前,还包括:对所述待分析的样本集中各样本的信息进行数据格式检查和/或完整性检查,获得各样本信息的检查结果;根据各样本信息的检查结果进行对应的处理。5.根据权利要求4所述的方法,其特征在于,所述根据各样本信息的检查结果进行对应的处理包括:在存在数据缺失率大于预设缺失率的第一样本时,向用户终端发送与所述第一样本的数据缺失率大于预设缺失率对应的提示信息;接收用户终端根据所述提示信息触发的操作指令对所述第一样本进行对应的处理。6.根据权利要求1所述的方法,其特征在于,所述以预设多个特征依次对所述待分析的样本集进行分类,获得多个样本子集,并将所述多个样本子集以所述预设多个特征为交叉节点构成样本二叉树之前,包括:根据所述待分析的样本集计算预设的多个特征的方差;根据各预设的多个特征的方差对预设的多个特征进行排序;所述以预设多个特征依次对所述待分析的样本集进行分类,获得多个样本子集,并将所述多个样本子集以所述预设多个特征为交叉节点构成样本二叉树包括:以排序后的预设多个特征依次对所述待分析的样本集进行分类,获得多个样本子集,并将所述多个样本子集以所述预设多个特征为交叉节点构成样本二叉树。7.一种授信额度的确定方法,其特征在于,所述方法包括:获取无授信额度客户的相似样本,所述无授信额度客户的相似样本采用如权利要求1
‑
6任一项所述的方法获得;根据所述相似样本的授信额度计算所述无授信额度客户的授信额度。8.根据权利要求7所述的方法,其特征在于,所述根据所述相似样本的授信额度计算所述无授信额度客户的授信额度,包括:获取所述相似样本的授信额度;将所述相似样本与所述无授信额度客户的相似度作为加权系数,对所述相似样本的授信额度进行加权计算,获得所述无授信额度客户的授信额度。9.根据权利要求7所述的方法,其特征在于,所述获取所述相似样本的授信额度之后,还包括:计算所述相似样...
【专利技术属性】
技术研发人员:程琬芸,梁栋,陈为,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。