【技术实现步骤摘要】
基于样本扩展的用户分析方法、装置、设备及存储介质
[0001]本申请实施例涉及大数据分析
,尤其涉及一种基于样本扩展的用户分析方法、装置、设备及存储介质。
技术介绍
[0002]目前在进行用户评级时,通常采用人工审核方式,人工抽取客户的关键性经济指标作为依据,根据各经济指标的数值进行风险等级的评估。
[0003]然而人工审核方式不仅速度慢而且准确性无法统一控制。通过模型进行用户评级时,由于有效的样本数据少,导致无法训练出可靠的评测模型,进而无法准确的评估用户评级。
技术实现思路
[0004]本申请提供一种基于样本扩展的用户分析方法、装置、设备及存储介质,用以解决现有技术中样本数据量少,无法训练可靠的评测模型,进而无法准确的评估用户评级的问题。
[0005]第一方面,本申请实施例提供了一种基于样本扩展的用户分析方法,包括:
[0006]根据对象样本数据确定初始样本,初始样本包括多个权重等级,权重等级用于表示对象样本数据中样本对象的重要性权重等级;
[0007]确定每个权重等级的原始等级数据,原始等级数据表示样本对象位于权重等级的概率;
[0008]根据原始等级数据进行样本扩展,得到模拟等级数据;
[0009]根据模拟等级数据所在权重等级和对象样本数据确定模拟等级数据的模拟最终得分;
[0010]根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;
[001 ...
【技术保护点】
【技术特征摘要】
1.一种基于样本扩展的用户分析方法,其特征在于,包括:根据对象样本数据确定初始样本,所述初始样本包括多个权重等级,所述权重等级用于表示所述对象样本数据中样本对象的重要性权重等级;确定每个权重等级的原始等级数据,所述原始等级数据表示所述样本对象位于所述权重等级的概率;根据所述原始等级数据进行样本扩展,得到模拟等级数据;根据所述模拟等级数据所在权重等级和所述对象样本数据确定所述模拟等级数据的模拟最终得分;根据所述初始样本和所述模拟等级数据,确定等级总体样本库;根据所述初始样本确定的初始样本最终得分和所述模拟等级数据的模拟最终得分,确定得分总体样本库;当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,所述总样本库包括所述等级总体样本库和所述得分总体样本库。2.根据权利要求1所述的方法,其特征在于,所述根据对象样本数据确定初始样本,包括:根据对象样本数据确定每个样本对象的最终得分;根据所述最终得分确定每个样本对象的重要性权重;根据所述重要性权重确定多个权重等级。3.根据权利要求2所述的方法,其特征在于,所述根据对象样本数据确定每个样本对象的最终得分,包括:根据目标对象样本数据的每个指标的分位确定指标权重,所述目标对象样本数据为任意一个对象样本数据;根据所述指标权重和指标内容确定目标样本对象的最终得分。4.根据权利要求3所述的方法,其特征在于,根据所述指标权重和指标内容确定目标样本对象的最终得分,包括:根据所述目标对象样本数据确定缺失指标;根据所述指标权重和指标内容以及所述缺失指标确定目标样本对象的最终得分。5.根据权利要求2所述的方法,其特征在于,所述根据所述最终得分确定每个样本对象的重要性权重,包括:根据层次分析法确定每个样本对象的重要性权重。6.根据权利要求5所述的方法,其特征在于,根据层次分析法确定每个样本对象的重要性权重,包括:根据多个样本对象的最终得分的比值,确定第一矩阵,所述第一矩阵每列对应一个样本对象,所述第一矩阵的元素ij为样本对象i的最终得分与样本对象j的最终得分的比值;根据所述第一矩阵的特征值确定每个样本对象的重要性权重。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一矩阵的特征值确定每个样本对象的重要性权重,包括:获取所述第一矩阵的最大特征值以及第一特征向量,所述第一特征向量为所述最大特征值对应的特征向量;将所述第一特征向量进行归一化处理,得到第二特征向量,所述第二特征向量中的元
素与样本对象一一对应。8.根据权利要求6所述的方法,其特征在于,所述根据所述第一矩阵的特征值确定每个样本对象的重要性权重,包括:对所述第一矩阵的每列进行归一化处理,得到第三矩阵;获取所述第三矩阵每列数据的平均值,将所述每列的平均值作为响应样本对象的重要性权重。9.根据权利要求2所述的方法,其特征在于,根据所述重要性权重确定多个权重等级,包括:根据重要性权重的数值进行排序;根据排序结果确定多个权重等级,每个权重等级包含的样本对象数量接近或相等。10.根据权利要求1所述的方法,其特征在于,所述根据所述原始等级数据进行样本扩展,得到模拟等级样本,包括:通过蒙特卡洛算法对原始等级数据进行扩展,得到扩展数据;将所述原始等级数据和所述扩展数据进行合并,得到合并数据;根据EM算法和扩展数据对蒙特卡洛算法的扩展参数进行调整,直至所述合并数据的概率分布固定;根据调整后的蒙特卡洛算法对所述原始等级数据进行扩展,得到模拟等级样本。11.根据权利要求1所述的方法,其特征在于,所述当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,包括:当触发目标用户评级请求时,获取目标用户最终得分;将所述目标用户最终得分合并至所述得分总体样本库,得到新得分总体样本库;根据所述新得分总体样本库确定目标用户权重估计值;根据所述目标用户权重估计值和所述等级总体样本库确定目标用户等级;根据所述目标用户等级反馈目标用户评级信息。12.根据权利要求1所述的方法,其特征在于,在根据所述初始样本和所述模拟等级数据,确定等级总体样本库;根据所述初始样本确定的初始样本最终得分和所述模拟等级数据的模拟最终得分,确定得分总体样本库之后,还包括:根据样本等级变化确定优质样本特征;若目标用户特征与所述优质样本特征匹配,输出目标用户的推荐信息。13.一种基于样本扩展的用户分析装置,其特征在于,包括:初始样本确定模块,用于根据对象样本数据确定初始样本,所述初始样本包括多个权重等级,所述权重等级用于表示所...
【专利技术属性】
技术研发人员:陈鹏,吕书径,李霞,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。