基于样本扩展的用户分析方法、装置、设备及存储介质制造方法及图纸

技术编号:35837215 阅读:22 留言:0更新日期:2022-12-03 14:08
本申请提供一种基于样本扩展的用户分析方法、装置、设备及存储介质。涉及大数据分析技术领域。该方法包括:根据对象样本数据确定初始样本,初始样本包括多个权重等级;确定每个权重等级的原始等级数据;根据原始等级数据进行样本扩展,得到模拟等级数据;根据模拟等级数据所在权重等级和对象样本数据确定模拟等级数据的模拟最终得分;根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,能够实现自动化的用户评价,提高用户评分的准确性。提高用户评分的准确性。提高用户评分的准确性。

【技术实现步骤摘要】
基于样本扩展的用户分析方法、装置、设备及存储介质


[0001]本申请实施例涉及大数据分析
,尤其涉及一种基于样本扩展的用户分析方法、装置、设备及存储介质。

技术介绍

[0002]目前在进行用户评级时,通常采用人工审核方式,人工抽取客户的关键性经济指标作为依据,根据各经济指标的数值进行风险等级的评估。
[0003]然而人工审核方式不仅速度慢而且准确性无法统一控制。通过模型进行用户评级时,由于有效的样本数据少,导致无法训练出可靠的评测模型,进而无法准确的评估用户评级。

技术实现思路

[0004]本申请提供一种基于样本扩展的用户分析方法、装置、设备及存储介质,用以解决现有技术中样本数据量少,无法训练可靠的评测模型,进而无法准确的评估用户评级的问题。
[0005]第一方面,本申请实施例提供了一种基于样本扩展的用户分析方法,包括:
[0006]根据对象样本数据确定初始样本,初始样本包括多个权重等级,权重等级用于表示对象样本数据中样本对象的重要性权重等级;
[0007]确定每个权重等级的原始等级数据,原始等级数据表示样本对象位于权重等级的概率;
[0008]根据原始等级数据进行样本扩展,得到模拟等级数据;
[0009]根据模拟等级数据所在权重等级和对象样本数据确定模拟等级数据的模拟最终得分;
[0010]根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;
[0011]当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,总样本库包括等级总体样本库和得分总体样本库。
[0012]第二方面,本申请实施例还提供了一种基于样本扩展的用户分装置,其特征在于,包括:
[0013]初始样本确定模块,用于根据对象样本数据确定初始样本,初始样本包括多个权重等级,权重等级用于表示对象样本数据中样本对象的重要性权重等级;
[0014]原始等级数据确定模块,用于确定每个权重等级的原始等级数据,原始等级数据表示样本对象位于权重等级的概率;
[0015]模拟等级数据生成模块,用于根据原始等级数据进行样本扩展,得到模拟等级数据;
[0016]模拟得分确定模块,用于根据模拟等级数据所在权重等级和对象样本数据确定模
拟等级数据的模拟最终得分;
[0017]总样本库确定模块,用于根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;
[0018]评分模块,用于当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,总样本库包括等级总体样本库和得分总体样本库。
[0019]第三方面,本申请实施例还提供了一种服务器,包括:处理器,以及与处理器通信连接的存储器;
[0020]存储器存储计算机执行指令;
[0021]处理器执行存储器存储的计算机执行指令,以实现如本申请实施例所示的基于样本扩展的用户分析方法。
[0022]第四方面,本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如本申请实施例所示的基于样本扩展的用户分析方法。
[0023]第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本申请实施例所示的基于样本扩展的用户分析方法。
[0024]本申请提供的基于样本扩展的用户分析方法、装置、设备及存储介质,根据对象样本数据确定初始样本,初始样本包括多个权重等级,权重等级用于表示对象样本数据中样本对象的重要性权重等级;确定每个权重等级的原始等级数据,原始等级数据表示样本对象位于权重等级的概率;根据原始等级数据进行样本扩展,得到模拟等级数据;根据模拟等级数据所在权重等级和对象样本数据确定模拟等级数据的模拟最终得分;根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,总样本库包括等级总体样本库和得分总体样本库。能够根据对象样本确定初始样本,根据初始样本确定用于表示样本对象重要性的权重等级,根据每个权重等级的原始等级数据进行样本扩展,得到模拟等级数据,进而形成总样本库,根据总样本库对目标用户进行评分。本专利技术能够基于样本对象的重要性权重参数进行样本扩展,得到模拟等级数据,能够更加真实的对不同权重等级内的样本进行扩展,而非常规的对样本对象的某个指标进行扩展,能够在保证各权重等级内样本数量均衡的同时实现更加准确的样本扩展。根据初始样本和模拟等级数据行程的总样本库能够具有更多的样本数量,实现在初始样本数量较少的情况下,对初始样本进行扩展,基于扩展后的模拟等级数据以及初始样本行程总样本库。根据总样本库对目标用户进行评价,能够实现自动化的用户评价,根据总样本库进行用户评分能够提高用户评分的准确性。
附图说明
[0025]图1是本申请实施例中提供的基于样本扩展的用户分析方法的流程图一;
[0026]图2是本申请实施例中提供的基于样本扩展的用户分析方法的流程图二;
[0027]图3是本申请实施例中提供的基于样本扩展的用户分析方法的流程图三;
[0028]图4是本申请实施例中提供的基于样本扩展的用户分析方法的流程图四;
[0029]图5是本申请实施例中提供的基于样本扩展的用户分析方法的流程图五;
[0030]图6是本申请实施例中提供的基于样本扩展的用户分析装置的结构示意图;
[0031]图7是本申请实施例中提供的电子设备的结构示意图。
具体实施方式
[0032]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0033]金融业务活动中,当用户申请某项金融业务时,需要获取用户评分,对用户进行评级。目前在进行用户评级时,通常采用人工审核方式,人工抽取客户的关键性经济指标作为依据,根据各经济指标的数值进行风险等级的评估。然而人工审核方式不仅速度慢而且准确性无法统一控制。通过模型进行用户评级时,由于有效的样本数据少,导致无法训练出可靠的评测模型,进而无法准确的评估用户评级。
[0034]如何能够利用少量的样本数据实现对用户的自动化的准确的用户等级评价,成为亟待解决的问题。
[0035]针对上述技术问题,本申请提出如下技术构思:根据对象样本数据确定每个样本对象的权重等级,根据权重等级确定原始等级数据,即不同重要等级中样本对象出现的概率,然本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于样本扩展的用户分析方法,其特征在于,包括:根据对象样本数据确定初始样本,所述初始样本包括多个权重等级,所述权重等级用于表示所述对象样本数据中样本对象的重要性权重等级;确定每个权重等级的原始等级数据,所述原始等级数据表示所述样本对象位于所述权重等级的概率;根据所述原始等级数据进行样本扩展,得到模拟等级数据;根据所述模拟等级数据所在权重等级和所述对象样本数据确定所述模拟等级数据的模拟最终得分;根据所述初始样本和所述模拟等级数据,确定等级总体样本库;根据所述初始样本确定的初始样本最终得分和所述模拟等级数据的模拟最终得分,确定得分总体样本库;当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,所述总样本库包括所述等级总体样本库和所述得分总体样本库。2.根据权利要求1所述的方法,其特征在于,所述根据对象样本数据确定初始样本,包括:根据对象样本数据确定每个样本对象的最终得分;根据所述最终得分确定每个样本对象的重要性权重;根据所述重要性权重确定多个权重等级。3.根据权利要求2所述的方法,其特征在于,所述根据对象样本数据确定每个样本对象的最终得分,包括:根据目标对象样本数据的每个指标的分位确定指标权重,所述目标对象样本数据为任意一个对象样本数据;根据所述指标权重和指标内容确定目标样本对象的最终得分。4.根据权利要求3所述的方法,其特征在于,根据所述指标权重和指标内容确定目标样本对象的最终得分,包括:根据所述目标对象样本数据确定缺失指标;根据所述指标权重和指标内容以及所述缺失指标确定目标样本对象的最终得分。5.根据权利要求2所述的方法,其特征在于,所述根据所述最终得分确定每个样本对象的重要性权重,包括:根据层次分析法确定每个样本对象的重要性权重。6.根据权利要求5所述的方法,其特征在于,根据层次分析法确定每个样本对象的重要性权重,包括:根据多个样本对象的最终得分的比值,确定第一矩阵,所述第一矩阵每列对应一个样本对象,所述第一矩阵的元素ij为样本对象i的最终得分与样本对象j的最终得分的比值;根据所述第一矩阵的特征值确定每个样本对象的重要性权重。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一矩阵的特征值确定每个样本对象的重要性权重,包括:获取所述第一矩阵的最大特征值以及第一特征向量,所述第一特征向量为所述最大特征值对应的特征向量;将所述第一特征向量进行归一化处理,得到第二特征向量,所述第二特征向量中的元
素与样本对象一一对应。8.根据权利要求6所述的方法,其特征在于,所述根据所述第一矩阵的特征值确定每个样本对象的重要性权重,包括:对所述第一矩阵的每列进行归一化处理,得到第三矩阵;获取所述第三矩阵每列数据的平均值,将所述每列的平均值作为响应样本对象的重要性权重。9.根据权利要求2所述的方法,其特征在于,根据所述重要性权重确定多个权重等级,包括:根据重要性权重的数值进行排序;根据排序结果确定多个权重等级,每个权重等级包含的样本对象数量接近或相等。10.根据权利要求1所述的方法,其特征在于,所述根据所述原始等级数据进行样本扩展,得到模拟等级样本,包括:通过蒙特卡洛算法对原始等级数据进行扩展,得到扩展数据;将所述原始等级数据和所述扩展数据进行合并,得到合并数据;根据EM算法和扩展数据对蒙特卡洛算法的扩展参数进行调整,直至所述合并数据的概率分布固定;根据调整后的蒙特卡洛算法对所述原始等级数据进行扩展,得到模拟等级样本。11.根据权利要求1所述的方法,其特征在于,所述当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,包括:当触发目标用户评级请求时,获取目标用户最终得分;将所述目标用户最终得分合并至所述得分总体样本库,得到新得分总体样本库;根据所述新得分总体样本库确定目标用户权重估计值;根据所述目标用户权重估计值和所述等级总体样本库确定目标用户等级;根据所述目标用户等级反馈目标用户评级信息。12.根据权利要求1所述的方法,其特征在于,在根据所述初始样本和所述模拟等级数据,确定等级总体样本库;根据所述初始样本确定的初始样本最终得分和所述模拟等级数据的模拟最终得分,确定得分总体样本库之后,还包括:根据样本等级变化确定优质样本特征;若目标用户特征与所述优质样本特征匹配,输出目标用户的推荐信息。13.一种基于样本扩展的用户分析装置,其特征在于,包括:初始样本确定模块,用于根据对象样本数据确定初始样本,所述初始样本包括多个权重等级,所述权重等级用于表示所...

【专利技术属性】
技术研发人员:陈鹏吕书径李霞
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1