本发明专利技术公开了一种数据处理方法及装置。其中,该方法包括:在用户授权条件下,获取终端设备上运行的应用程序;在上述应用程序为多个的情况下,分别确定多个上述应用程序所属的集合,并依据每个上述集合中包含的上述应用程序的数量,将每个上述集合划分为多个子集;将上述多个子集中的应用程序数据输入至平均单依赖估计AODE模型,其中,上述AODE模型用于挖掘上述应用程序数据中隐含的风险数据;接收上述AODE模型输出的上述风险数据。本发明专利技术解决了现有技术中难以有效利用应用程序数据挖掘隐含的风险数据,导致无法为风险识别模型提供区分度更好的变量数据的技术问题。
【技术实现步骤摘要】
数据处理方法及装置
本专利技术涉及数据处理
,具体而言,涉及一种数据处理方法及装置。
技术介绍
随着市场上信用产品的不断丰富和普及,越来越多的人从中享受到了便利,但是有些消费习惯不好的用户,在享受到了权益后却不履行相应的义务,做出一些不守信的行为,给市场带来了一定的风险,例如,秉承客户至上的理念,在酒店预订场景下,许多的酒店预订平台为用户推出“闪住”服务,即先住酒店后付钱的服务,给客户带来更好的体验。客户在使用闪住之前需要开通银行卡、支付宝或微信等免密支付方式,酒店预订平台可以在客户离店后自动扣出房费,但是,闪住在提升客户体验的同时,会带来一定的风险。当酒店预订平台不能从客户的授权免密支付方式中扣出房费,并且客户自身也没有支付意愿时,就会发生逾期,给市场的信用环境带来不良影响,同时平台也会产生一定的资损。因此,需要尽可能在这些用户或者交易中识别出风险较低的部分,为市场保驾护航。随着手机应用的普及,各大公司针对自己的产品也会推出app端,例如携程、淘宝、微信等等。app信息可以综合反映一个人的需求、偏好和身份等信息,例如手机里安装旅游类的app较多,可能是一个爱好旅行的人;手机里安装商务办公类的app,可能是一个工作人士;手机里有安装借贷类的app,可能是一个急需资金的人,等等。在风控场景下,如果用户授权访问手机上的app信息,一方面增加了数据的丰富性,另一方面补充了用户不限于酒店预订平台的整体财富能力和身份特质等信息,例如,若一个用户安装了很多不正规的借贷类app,可能身份偏差,财富水平偏低;若一个用户安装了很多赌博类app,可能存在一定的信用风险。若用户授权,我们可以通过applist数据衍生出一些常见的特征,来反映用户的风险。但是想要充分挖掘app包含的信息,常用方法很难满足这一点,如何全面利用applist数据,挖掘隐含的风险规律,进而为风险识别模型提供区分度更好的变量,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据处理方法及装置,以至少解决现有技术中难以有效利用应用程序数据挖掘隐含的风险数据,导致无法为风险识别模型提供区分度更好的变量数据的技术问题。根据本专利技术实施例的一个方面,提供了一种数据处理方法,其特征在于,包括:在用户授权条件下,获取终端设备上运行的应用程序;在上述应用程序为多个的情况下,分别确定多个上述应用程序所属的集合,并依据每个上述集合中包含的上述应用程序的数量,将每个上述集合划分为多个子集;将上述多个子集中的应用程序数据输入至平均单依赖估计AODE模型,其中,上述AODE模型用于挖掘上述应用程序数据中隐含的风险数据;接收上述AODE模型输出的上述风险数据。可选地,在接收上述AODE模型输出的上述风险数据之后,上述方法还包括:将上述风险数据作为输入变量输入至风险识别模型,其中,上述风险识别模型用于通过识别上述处理后应用程序数据,确定与上述终端设备对应的用户信用特征信息;接收上述风险识别模型输出的上述用户信用特征信息。可选地,在将上述风险数据输入至风险识别模型之前,上述方法还包括:采用拉普拉斯平滑算法,对上述风险数据进行平滑处理。可选地,依据每个上述集合中包含的上述应用程序的数量,将每个上述集合划分为多个子集,包括:通过对每个上述集合中包含的上述应用程序的数量进行分箱处理,得到多个属性区间,其中,每个上述属性区间表示一个特征取值范围,其中,上述分箱处理的算法包括以下至少之一:等频分箱、等距分箱、卡方分箱、决策树分箱;依据上述属性区间,将每个上述集合划分为多个子集。可选地,若所有上述子集的数量为k,则采用除每个子集之外的k-1个子集训练上述AODE模型,得到与每个上述子集对应的上述风险数据的预测概率。根据本专利技术实施例的另一方面,还提供了一种数据处理装置,包括:获取模块,用于在用户授权条件下,获取终端设备上运行的应用程序;预处理模块,用于在上述应用程序为多个的情况下,分别确定多个上述应用程序所属的集合,并依据每个上述集合中包含的上述应用程序的数量,将每个上述集合划分为多个子集;第一输入模块,用于将上述多个子集中的应用程序数据输入至平均单依赖估计AODE模型,其中,上述AODE模型用于挖掘上述应用程序数据中隐含的风险数据;第一接收模块,用于接收上述AODE模型输出的上述风险数据。可选地,上述装置还包括:第二输入模块,用于将上述风险数据作为输入变量输入至风险识别模型,其中,上述风险识别模型用于通过识别上述处理后应用程序数据,确定与上述终端设备对应的用户信用特征信息;第二接收模块,用于接收上述风险识别模型输出的上述用户信用特征信息。可选地,上述装置还包括:平滑处理模块,用于采用拉普拉斯平滑算法,对上述风险数据进行平滑处理。可选地,上述预处理模块,包括:分箱处理模块,用于通过对每个上述集合中包含的上述应用程序的数量进行分箱处理,得到多个属性区间,其中,每个上述属性区间表示一个特征取值范围,其中,上述分箱处理的算法包括以下至少之一:等频分箱、等距分箱、卡方分箱、决策树分箱;划分处理模块,用于依据上述属性区间,将每个上述集合划分为多个子集。可选地,若所有上述子集的数量为k,则采用除每个子集之外的k-1个子集训练上述AODE模型,得到与每个上述子集对应的上述风险数据的预测概率。根据本专利技术实施例的另一方面,还提供了一种存储介质,上述存储介质包括存储的程序,其中,在上述程序运行时控制上述存储介质所在设备执行任意一项上述的数据处理方法。根据本专利技术实施例的另一方面,还提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行任意一项上述的数据处理方法。在本专利技术实施例中,通过在用户授权条件下,获取终端设备上运行的应用程序;在上述应用程序为多个的情况下,分别确定多个上述应用程序所属的集合,并依据每个上述集合中包含的上述应用程序的数量,将每个上述集合划分为多个子集;将上述多个子集中的应用程序数据输入至平均单依赖估计AODE模型,其中,上述AODE模型用于挖掘上述应用程序数据中隐含的风险数据;接收上述AODE模型输出的上述风险数据,达到了有效利用应用程序数据挖掘隐含的风险数据的目的,从而实现了为风险识别模型提供区分度更好的变量数据的技术效果,进而解决了现有技术中难以有效利用应用程序数据挖掘隐含的风险数据,导致无法为风险识别模型提供区分度更好的变量数据的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种数据处理方法的流程图;图2是根据本专利技术实施例的一种数据处理装置的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的本文档来自技高网...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n在用户授权条件下,获取终端设备上运行的应用程序;/n在所述应用程序为多个的情况下,分别确定多个所述应用程序所属的集合,并依据每个所述集合中包含的所述应用程序的数量,将每个所述集合划分为多个子集;/n将所述多个子集中的应用程序数据输入至平均单依赖估计AODE模型,其中,所述AODE模型用于挖掘所述应用程序数据中隐含的风险数据;/n接收所述AODE模型输出的所述风险数据。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
在用户授权条件下,获取终端设备上运行的应用程序;
在所述应用程序为多个的情况下,分别确定多个所述应用程序所属的集合,并依据每个所述集合中包含的所述应用程序的数量,将每个所述集合划分为多个子集;
将所述多个子集中的应用程序数据输入至平均单依赖估计AODE模型,其中,所述AODE模型用于挖掘所述应用程序数据中隐含的风险数据;
接收所述AODE模型输出的所述风险数据。
2.根据权利要求1所述的方法,其特征在于,在接收所述AODE模型输出的所述风险数据之后,所述方法还包括:
将所述风险数据作为输入变量输入至风险识别模型,其中,所述风险识别模型用于通过识别所述处理后应用程序数据,确定与所述终端设备对应的用户信用特征信息;
接收所述风险识别模型输出的所述用户信用特征信息。
3.根据权利要求1所述的方法,其特征在于,在将所述风险数据输入至风险识别模型之前,所述方法还包括:
采用拉普拉斯平滑算法,对所述风险数据进行平滑处理。
4.根据权利要求1所述的方法,其特征在于,依据每个所述集合中包含的所述应用程序的数量,将每个所述集合划分为多个子集,包括:
通过对每个所述集合中包含的所述应用程序的数量进行分箱处理,得到多个属性区间,其中,每个所述属性区间表示一个特征取值范围,其中,所述分箱处理的算法包括以下至少之一:等频分箱、等距分箱、卡方分箱、决策树分箱;
依据所述属性区间,将每个所述集合划分为多个子集。
5.根据权利要求4所述的方法,其特征在于,若所有所述子集的数量为k,则采用除每个子集之外的k-1个子集训练所述AODE模型,得到与每个所述子集对应的所述风险数据的预测概率。
6.一种数据处理装置,其特征在于,包括:
获取模块,用于在用户授权条件下,获取终端设备上运行的应用程序;
预处理模块,用于在所述应用程序为多个的...
【专利技术属性】
技术研发人员:丁炜,霍文虎,
申请(专利权)人:北京互金新融科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。