The embodiment of the invention provides a data validation method and a device. After obtaining the user's credit data within a predetermined time period and the corresponding credit score, the application will calculate the confidence interval of the user's credit score under a given confidence level according to the preset algorithm and using the credit data within the preset time period to predict the credit score. Based on the user's credit score and the confidence interval, a preset operation is performed for the user. Compared with the scheme in the prior art that only the user's credit score is based on the size of the user's credit score and the preset operation is performed for the user, the application increases the recognition of the user's credit score and improves the credit quality. The identification accuracy of bad users can provide corresponding control strategies for different users with the same credit score, and better serve the users with high real credit.
【技术实现步骤摘要】
一种数据验证方法及装置
本专利技术涉及数据真实性验证领域,具体涉及一种数据验证方法及装置。
技术介绍
如今,在很多应用场景中,经常会利用用户的征信分来表示用户信用好坏,即用户的征信分越大,表示用户的信用度越高,从而实现用户信用等级的划分,并针对不同信用等级的用户采用不同的控制策略,来为用户服务。然而,对于同一信用等级的用户,甚至是相同征信分的多个用户来说,这些用户实际行为并不相同;而且,随着用户的征信数据还会随着时间发生很大波动,即便征信分高的用户可信度也不一定比征信分低的用户可信度高。这都将会导致根据用户征信分的大小确定的控制策略不合适,甚至会出现为高征信分但低信用的用户增大资源分配额度的情况,给企业或个人造成损失。由此可见,如何确定用户的真实信用,为用户分配合适的控制策略成为本领域技术人员关注的重点。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据验证方法及装置,通过用户征信分的置信区间,来确定该征信分的可信度,从而根据该可信度以及征信分大小,确定针对用户的合适的预设操作。为实现上述目的,本专利技术实施例提供如下技术方案:本申请实施例提供了一种数据验证方法,所述方法包括:获取用户在预设时间段内的征信数据以及对应的征信分,所述征信分用于预测用户行为的可信度;根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,所述征信分的置信区间用于预测所述信用分的可信度;基于所述用户的征信分以及所述置信区间,针对所述用户执行相应的预设操作。本申请实施例还提供了一种数据验证装置,所述装置包括:数据获取模块,用于获取用户在预设时间段内 ...
【技术保护点】
1.一种数据验证方法,其特征在于,所述方法包括:获取用户在预设时间段内的征信数据以及对应的征信分,所述征信分用于预测用户行为的可信度;根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,所述征信分的置信区间用于预测所述信用分的可信度;基于所述用户的征信分以及所述置信区间,针对所述用户执行相应的预设操作。
【技术特征摘要】
1.一种数据验证方法,其特征在于,所述方法包括:获取用户在预设时间段内的征信数据以及对应的征信分,所述征信分用于预测用户行为的可信度;根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,所述征信分的置信区间用于预测所述信用分的可信度;基于所述用户的征信分以及所述置信区间,针对所述用户执行相应的预设操作。2.根据权利要求1所述的方法,其特征在于,所述基于所述用户的征信分以及对应的置信区间,针对所述用户执行相应的预设操作,包括:确定所述用户的征信分所在信用等级以及所述置信区间的宽度;判断所述置信区间的宽度是否大于预设宽度阈值;如果否,执行所述信用等级下针对所述用户的第一预设操作;如果是,执行所述信用等级下针对所述用户的第二预设操作。3.根据权利要求1所述的方法,其特征在于,当获取的征信数据包括N个用户在所述预设时间段内的征信数据,所述根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,包括:通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本;根据预设模型训练算法,对所述训练样本进行模型训练,得到预测用户行为可信度的概率模型,返回所述通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本步骤,直至得到N个所述概率模型;根据所述N个所述概率模型,利用任一所述用户在所述预设时间段内的征信数据,确定所述用户的征信分分布;利用确定的所述征信分分布,获得给定置信度下所述用户的征信分在所述预设时间段内的置信区间。4.根据权利要求1所述的方法,其特征在于,所述根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分在所述预设时间段内的置信区间,包括:根据预设参数模型以及最大似然算法,利用所述预设时间段内的征信数据,确定所述用户在所述预设时间段内的违约概率分布;利用确定的所述违约概率分布,获得给定置信度下所述用户在所述预设时间段内的违约率置信区间;根据预设的违约率与征信分之间的转化关系,将所述违约率置信区间转化为征信分置信区间。5.根据权利要求3所述的方法,其特征在于,所述通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本,包括:利用所述预设时间段中的多个时间确定对应的时间序列;将属于同一用户的所述多个时间内的征信数据确定为一个样本序号,并利用得到N个不同的样本序号,确定一个样本序列;利用自助抽样法对所述时间序列以及样本序列进行抽样处理,确定一组新的时间序列以及新的样本序列;按照所述新的样本序列中所述样本序号的排序,以及所述新的时间序列中所述时间的排序,依次获得所述样本序号与所述时间对应的征信数据;利用依次获得的所述征信数据以及对应的信用标记,获得训练样本。6.根据权利要求5所述的方法,其特征在于,所述返回所述通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本步骤,直至得到N个所述概率模型,包括:判断当前是否得到N个所述概率模型;如果否,将所述新的时间序列作为初始的所述时间序列,并将所述新的样本序列...
【专利技术属性】
技术研发人员:刘成烽,刘志斌,陈谦,黄巩怡,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。