一种数据验证方法及装置制造方法及图纸

技术编号:18714378 阅读:32 留言:0更新日期:2018-08-21 23:12
本发明专利技术实施例提供了一种数据验证方法及装置,在获得用户在预设时间段内的征信数据以及对应的征信分后,本申请将根据预设算法,利用该预设时间段内的征信数据,计算给定置信度下用户的征信分的置信区间,来预测该征信分的可信度,从而基于该用户的征信分以及该置信区间,针对该用户执行相应预设操作,与现有技术中仅基于用户的征信分大小,针对用户执行预设操作的方案相比,本申请增加了对用户征信分可信度的识别,提高了信用好坏用户的识别准确性,能够为同一征信分不同行为用户分别提供相应的控制策略,更好地为真正信用高的用户提供服务。

A data validation method and device

The embodiment of the invention provides a data validation method and a device. After obtaining the user's credit data within a predetermined time period and the corresponding credit score, the application will calculate the confidence interval of the user's credit score under a given confidence level according to the preset algorithm and using the credit data within the preset time period to predict the credit score. Based on the user's credit score and the confidence interval, a preset operation is performed for the user. Compared with the scheme in the prior art that only the user's credit score is based on the size of the user's credit score and the preset operation is performed for the user, the application increases the recognition of the user's credit score and improves the credit quality. The identification accuracy of bad users can provide corresponding control strategies for different users with the same credit score, and better serve the users with high real credit.

【技术实现步骤摘要】
一种数据验证方法及装置
本专利技术涉及数据真实性验证领域,具体涉及一种数据验证方法及装置。
技术介绍
如今,在很多应用场景中,经常会利用用户的征信分来表示用户信用好坏,即用户的征信分越大,表示用户的信用度越高,从而实现用户信用等级的划分,并针对不同信用等级的用户采用不同的控制策略,来为用户服务。然而,对于同一信用等级的用户,甚至是相同征信分的多个用户来说,这些用户实际行为并不相同;而且,随着用户的征信数据还会随着时间发生很大波动,即便征信分高的用户可信度也不一定比征信分低的用户可信度高。这都将会导致根据用户征信分的大小确定的控制策略不合适,甚至会出现为高征信分但低信用的用户增大资源分配额度的情况,给企业或个人造成损失。由此可见,如何确定用户的真实信用,为用户分配合适的控制策略成为本领域技术人员关注的重点。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据验证方法及装置,通过用户征信分的置信区间,来确定该征信分的可信度,从而根据该可信度以及征信分大小,确定针对用户的合适的预设操作。为实现上述目的,本专利技术实施例提供如下技术方案:本申请实施例提供了一种数据验证方法,所述方法包括:获取用户在预设时间段内的征信数据以及对应的征信分,所述征信分用于预测用户行为的可信度;根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,所述征信分的置信区间用于预测所述信用分的可信度;基于所述用户的征信分以及所述置信区间,针对所述用户执行相应的预设操作。本申请实施例还提供了一种数据验证装置,所述装置包括:数据获取模块,用于获取用户在预设时间段内的征信数据以及对应的征信分,所述征信分用于预测用户行为的可信度;计算模块,用于根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,所述征信分的置信区间用于预测所述信用分的可信度;执行模块,用于基于所述用户的征信分以及对应的置信区间,针对所述用户执行相应的预设操作。基于上述技术方案,本专利技术实施例提供了一种数据验证方法及装置,在获得用户在预设时间段内的征信数据以及对应的征信分后,本申请将根据预设算法,利用该预设时间段内的征信数据,计算给定置信度下用户的征信分的置信区间,来预测该征信分的可信度,从而基于该用户的征信分以及该置信区间,针对该用户执行相应预设操作,与现有技术中仅基于用户的征信分大小,针对用户执行预设操作的方案相比,本申请增加了对用户征信分可信度的识别,提高了信用好坏用户的识别准确性,能够为同一征信分不同行为用户分别提供相应的控制策略,更好地为真正信用高的用户提供服务。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例提供的一种的系统架构图;图2为本申请实施例提供的一种数据验证方法的流程图;图3为本申请实施例提供的另一种数据验证方法的流程图;图4为本申请实施例提供的又一种数据验证方法的流程图;图5为本申请实施例提供的一种数据验证装置的结构框图;图6为本申请实施例提供的另一种数据验证装置的结构框图;图7为本申请实施例提供的又一种数据验证装置的结构框图;图8为本申请实施例提供的又一种数据验证装置的结构框图;图9为本申请实施例提供的一种数据验证装置的硬件结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了准确理解本申请技术方案,本申请在此先对本申请下文描述的技术方案中涉及到的技术术语进行解释说明。置信区间(confidenceinterval):根据样本计算得到的关于总体参数值的区间估计,区间估计不唯一。在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计,置信区间展现的是这个参数的真实值有一定概率(即置信水平)落在测量结果的周围的程度,所以说,置信区间给出的是被测量参数的测量值的可信程度。本申请中,可以通过该置信区间的宽度表示用户征信分的可信度。置信度(confidencelevel):也称为置信水平,描述总体参数值落在通过样本计算得到的某一区间(即上述置信区间)内的概率,可以表示特定个体对待特定命题真实性相信的程度。在实际应用中,置信度通常不会达到100%,统计值与总体参数值之间总会有些误差,可以根据实际需要给定95%(本申请对该数值不作限定)的置信度,并在该置信度下,计算征信分的置信区间,由于征信分位于该置信区间内,所以,该置信区间的宽度越小,表示所得征信分的可信度越高。最大似然估计(maximumlikelihoodestimation):又称最大似然法,其基本思想是当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大,也就是说,其满足使得样本似然函数最大化得到的参数值。自助抽样法(bootstrap):是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。本申请可以采用这种抽样法对样本数据进行再抽样,获得对总体参数值分布的估计。图1为本申请实施例提供的实现信息验证方法的系统架构图,如图1所示,该系统可以包括:客户端11、服务器12以及征信数据库13。其中,客户端11可以装载在手机、平板电脑、笔记本电脑等用户设备上,在实际应用中,通过与服务器12建立通信连接,用户可以通过客户端11访问服务器12,支持客户端11实现其功能,为用户提供所需服务。可选的,客户端11可以是与服务器12相匹配的应用程序,用户可以通过应用官方网站或应用中心等,下载并安装到用户设备上。当然,客户端11也可以以浏览器的形式存在,本申请对客户端11的存在形式不作限定。服务器12可以是网络侧为用户提供服务的服务设备,其可能是多台服务器组成的服务器集群,也可能是单台服务器。本申请对此不作限定。在实际应用中,用户通过客户端11与服务器12进行通信,具体可以在第一应用平台上进行操作,以满足用户实际需要。且在该过程中,可以通过相应的应用数据库记录用户在该第一应用平台上的行为数据,作为用户信用度一方面的数据参考。征信数据库13可以记录用户可以在第二应用平台上的用户信贷记录、用户社交行为等数据,可以结合上述用户的行为数据,作为历史征信数据,用来综合判定用户信用程度的征信分,其在一定程度上可以反应用户在未来一段时间内按时还款的该里或债务违约的概率。在实际应用中,服务器12可以根据用户在第二应用平台的账号或其他用户标识信息,从征信数据库13中获取该用户的历史征信数据,并根据需要将该历史征信数据发送至客户端11,以使客户端11利用该历史征信数据完成预设操作。在本申请中,用户的征信分可以通过训练预测用户信用的模型,将用户在金融、网络社交等多维度的征信数据导入到该模型中计算得到,本申请对本文档来自技高网...

【技术保护点】
1.一种数据验证方法,其特征在于,所述方法包括:获取用户在预设时间段内的征信数据以及对应的征信分,所述征信分用于预测用户行为的可信度;根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,所述征信分的置信区间用于预测所述信用分的可信度;基于所述用户的征信分以及所述置信区间,针对所述用户执行相应的预设操作。

【技术特征摘要】
1.一种数据验证方法,其特征在于,所述方法包括:获取用户在预设时间段内的征信数据以及对应的征信分,所述征信分用于预测用户行为的可信度;根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,所述征信分的置信区间用于预测所述信用分的可信度;基于所述用户的征信分以及所述置信区间,针对所述用户执行相应的预设操作。2.根据权利要求1所述的方法,其特征在于,所述基于所述用户的征信分以及对应的置信区间,针对所述用户执行相应的预设操作,包括:确定所述用户的征信分所在信用等级以及所述置信区间的宽度;判断所述置信区间的宽度是否大于预设宽度阈值;如果否,执行所述信用等级下针对所述用户的第一预设操作;如果是,执行所述信用等级下针对所述用户的第二预设操作。3.根据权利要求1所述的方法,其特征在于,当获取的征信数据包括N个用户在所述预设时间段内的征信数据,所述根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分的置信区间,包括:通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本;根据预设模型训练算法,对所述训练样本进行模型训练,得到预测用户行为可信度的概率模型,返回所述通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本步骤,直至得到N个所述概率模型;根据所述N个所述概率模型,利用任一所述用户在所述预设时间段内的征信数据,确定所述用户的征信分分布;利用确定的所述征信分分布,获得给定置信度下所述用户的征信分在所述预设时间段内的置信区间。4.根据权利要求1所述的方法,其特征在于,所述根据预设算法,利用所述预设时间段内的征信数据,计算给定置信度下所述用户的征信分在所述预设时间段内的置信区间,包括:根据预设参数模型以及最大似然算法,利用所述预设时间段内的征信数据,确定所述用户在所述预设时间段内的违约概率分布;利用确定的所述违约概率分布,获得给定置信度下所述用户在所述预设时间段内的违约率置信区间;根据预设的违约率与征信分之间的转化关系,将所述违约率置信区间转化为征信分置信区间。5.根据权利要求3所述的方法,其特征在于,所述通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本,包括:利用所述预设时间段中的多个时间确定对应的时间序列;将属于同一用户的所述多个时间内的征信数据确定为一个样本序号,并利用得到N个不同的样本序号,确定一个样本序列;利用自助抽样法对所述时间序列以及样本序列进行抽样处理,确定一组新的时间序列以及新的样本序列;按照所述新的样本序列中所述样本序号的排序,以及所述新的时间序列中所述时间的排序,依次获得所述样本序号与所述时间对应的征信数据;利用依次获得的所述征信数据以及对应的信用标记,获得训练样本。6.根据权利要求5所述的方法,其特征在于,所述返回所述通过自助抽样法对所述N个用户在所述预设时间段内的征信数据进行抽样处理,得到训练样本步骤,直至得到N个所述概率模型,包括:判断当前是否得到N个所述概率模型;如果否,将所述新的时间序列作为初始的所述时间序列,并将所述新的样本序列...

【专利技术属性】
技术研发人员:刘成烽刘志斌陈谦黄巩怡
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1