数据评分方法及装置制造方法及图纸

技术编号:32177813 阅读:27 留言:0更新日期:2022-02-08 15:38
本公开提供一种数据评分方法及装置,所述方法包括获取拟评分样本数据集,根据表征所述拟评分样本数据集的特征对所述拟评分样本数据集进行分类,获取多个样本类别;按照预设匹配规则,确定与所述多个样本类别对应的第一评分模型;根据所述第一评分模型,获取每个样本类别中每个样本数据对应的第一评分;基于所述第一评分确定每个样本数据在其所在样本类别中的排序位置,通过预设的第二评分模型,确定每个样本类别中每个样本数据对应的第二评分。本公开提供的数据评分方法能够减少建模所需数量,并且能够将模型评分进行分数映射,使得特征较为丰富类别样本对应的模型结果更可靠。特征较为丰富类别样本对应的模型结果更可靠。特征较为丰富类别样本对应的模型结果更可靠。

【技术实现步骤摘要】
数据评分方法及装置


[0001]本公开涉及数据处理
,尤其涉及一种数据评分方法及装置。

技术介绍

[0002]现有对数据进行评分的方法主要包括三种:
[0003]第一、基于单一模型对多分布数据进行评分,
[0004]其主要是利用主流的逻辑回归、树模型、神经网络等建模方法对全部的数据进行建模,然后直接利用建好的模型对需要评分的数据进行打分,将模型打分的结果做为最终结果;
[0005]基于单一模型对多分布数据进行建模这种方法,在全部数据集不是很大的情况下,模型可能更多侧重拟合某些场景下占比较大的数据集,例如针对孕期女性,母婴类产品的数据集相比于其他产品在该场景下占比较大,而对于占比较大的数据集,模型不管是训练过程中,还是实际分析过程中,对占比较大的数据集利用率均更高,因此模型更加侧重拟合占比较大的数据集,对占比较小的数据集拟合度不够,会造成一定程度的精度损失。
[0006]第二、基于多个模型对多分布数据进行评分,
[0007]其主要是在已知数据集包括不同业务形态时,可以根据业务划分抽取出不同的数据集,然本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据评分方法,其特征在于,包括:获取拟评分样本数据集,根据表征所述拟评分样本数据集的特征对所述拟评分样本数据集进行分类,获取多个样本类别;按照预设匹配规则,确定与所述多个样本类别对应的第一评分模型;根据所述第一评分模型,获取每个样本类别中每个样本数据对应的第一评分;基于所述第一评分确定每个样本数据在其所在样本类别中的排序位置,通过预设的第二评分模型,确定每个样本类别中每个样本数据对应的第二评分。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据表征所述拟评分样本数据集的特征,通过聚类算法对所述拟评分样本数据集进行分类,获取分类后拟评分样本数据集中每个样本类别中每个样本数据的相关参数;根据所述相关参数,对每个样本类别进行排序,确定每个样本类别在所述拟评分样本数据集的排名,其中,所述相关参数包括影响所述样本类别在所述拟评分样本数据集的排名的参数。3.根据权利要求1所述的方法,其特征在于,所述按照预设匹配规则,确定与所述多个样本类别对应的第一评分模型的方法包括:获取所述拟评分样本数据集对应的业务需求、业务特点、以及所述拟评分样本数据集中样本特征类型中至少一种,根据所述业务需求、业务特点、样本特征类型中至少一种,按照预设匹配规则,确定与所述多个样本类别对应的第一评分模型,其中,所述第一评分模型包括神经网络模型、树模型以及逻辑回归模型中至少一种。4.根据权利要求1

3任一项所述的方法,其特征在于,所述基于所述第一评分确定每个样本在其所在样本类别中的排序位置,通过预设的第二评分模型,确定每个样本类别中每个样本对应的第二评分的方法包括:基于每个样本在其所在样本类别中的排序位置,确定每个样本在其所在样本类别中排名比例;通过预设的第二评分模型,获取每个样本类别对应的映射函数,根据所述映射函数,确定每个样本类别中每个样本对应的第二评分,其中,所述样本类别与所述映射函数一一对应,所述第一评分用于指示所述第一评分模型对每个样本类别评分的评估概率值,所述第二评分用于指示所述第二评分模型对所述第一评分调整后的分数值。5.根据权利要求4所述的方法,其特征在于,所述映射函数包括:其中,Final_score表示所述第二评分,

表示样本类别对应的系数,model1
top
n
i
表示第i个样本类别中,按照第一评分从高到低排的第n个样本,N
i
表...

【专利技术属性】
技术研发人员:谢树坤
申请(专利权)人:同盾网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1