本申请实施例提供了一种交易数据处理方法、装置、设备及存储介质,涉及数据分析技术领域,该方法包括:获取当前周期内待评估对象在至少一个特征维度的交易特征。基于特征维度对应的特征评分模型,以及特征维度的交易特征,确定特征维度的特征评分值,特征评分模型是通过数据拟合获得的。通过数据拟合获得每个特征维度对应的特征评分模型,减少了前期模型训练的工作量和模型部署时间,降低了模型使用门槛。在横向基于至少一个特征维度的特征评分值,获得待评估对象的初步评估分值,再在纵向基于待评估对象的初步评估分值和待评估对象的历史评估分值,获得待评估对象在当前周期的综合评估分值,从而提高评分的准确性。从而提高评分的准确性。从而提高评分的准确性。
【技术实现步骤摘要】
一种交易数据处理方法、装置、设备及存储介质
[0001]本专利技术涉及数据分析
,尤其涉及一种交易数据处理方法、装置、设备及存储介质。
技术介绍
[0002]数据分析以及挖掘技术,其核心在于基于海量的数据对业务场景的需求进行量化处理。在量化过程中,常采用评分模型对待评估对象进行评分。比如,个性化推荐系统通过评分模型对应用或商铺进行评分,并基于应用或商铺的评分,对应用或商铺进行推荐,其中,主流的评分模型包括Xgboost、GBDT等复杂模型。
[0003]然而,对于复杂模型来说,使用门槛较高,前期模型训练的工作量较大,部署时间长。
技术实现思路
[0004]本申请实施例提供了一种交易数据处理方法、装置、设备及存储介质,用于减少前期模型训练的工作量,降低模型使用门槛,缩短模型部署时间。
[0005]一方面,本申请实施例提供了一种交易数据处理方法,包括:
[0006]获取当前周期内待评估对象在至少一个特征维度的交易特征;
[0007]针对每个特征维度,基于所述特征维度对应的特征评分模型,以及所述特征维度的交易特征,确定所述特征维度的特征评分值,所述特征评分模型是通过数据拟合获得的;
[0008]基于所述至少一个特征维度的特征评分值,获得所述待评估对象的初步评估分值;
[0009]基于所述待评估对象的初步评估分值和所述待评估对象的历史评估分值,获得所述待评估对象在所述当前周期的综合评估分值。
[0010]本申请实施例中,通过数据拟合获得每个特征维度对应的特征评分模型,相较于复杂模型来说,减少了前期模型训练的工作量,降低了模型使用门槛,缩短了模型部署时间。其次,采用特征评分模型,基于特征维度的交易特征,确定特征维度的特征评分值,然后在横向基于至少一个特征维度的特征评分值,获得待评估对象的初步评估分值,再在纵向基于待评估对象的初步评估分值和待评估对象的历史评估分值,获得待评估对象在当前周期的综合评估分值,从而提高评分的准确性。
[0011]可选地,所述特征评分模型是通过数据拟合获得的,包括:
[0012]针对每个特征维度,获取多个样本对象在所述特征维度的原始交易数据;
[0013]对所述原始交易数据中的异常交易数据进行剔除,获得候选交易数据;
[0014]对所述候选交易数据进行分箱处理,获得所述特征维度的样本特征数据;
[0015]基于所述特征维度的样本特征数据进行数据拟合,获得所述特征维度对应的特征评分模型。
[0016]本申请实施例中,通过对获取到的原始交易数据进行异常值剔除得到候选交易数
据,使用于模型训练的数据更加准确,从而提高模型训练的效果。其次,对候选交易数据进行分箱处理可以缩短数据处理的周期,从而提升模型训练的效率。
[0017]可选地,所述对所述原始交易数据中的异常交易数据进行剔除,获得候选交易数据,包括:
[0018]对所述原始交易数据进行划分,并基于划分结果,从所述原始交易数据中获得第一个分位数和最后一个分位数;
[0019]基于所述第一个分位数和所述最后一个分位数,确定所述原始交易数据的筛选阈值;
[0020]对所述原始交易数据中大于所述筛选阈值的异常交易数据进行剔除,获得候选交易数据。
[0021]本申请实施例中,通过借鉴分位思想将原始交易数据分成若干份,然后基于划分结果计算筛选阈值,通过筛选阈值将异常交易数据划分出来,从而为模型训练提供质量较高的数据。
[0022]可选地,所述对所述候选交易数据进行分箱处理,获得所述特征维度的样本特征数据,包括:
[0023]将所述候选交易数据划分为多个区间段的子交易数据;
[0024]针对每个区间段,将所述区间段的中心值,作为所述区间段的子交易数据的交易表征值;以及,基于所述区间段内的子交易数据和位于所述区间段之前的历史区间段内的子交易数据,统计所述区间段对应的累积样本数量;
[0025]对所述多个区间段各自对应的子交易数据的交易表征值,以及所述多个区间段各自对应的累积样本数量映射至预设数值区间内,获得所述特征维度的样本特征数据。
[0026]本申请实施例中,通过用每个区间段的中心值来代表该区间段,减少了计算量。通过将交易表征值和所对应的累计样本数量映射至预设区间段,即通过累计分布函数将候选交易数据映射到一个框架内,提高了后续数据拟合的效率。
[0027]可选地,所述基于所述特征维度的样本特征数据进行数据拟合,获得所述特征维度对应的特征评分模型,包括:
[0028]对映射后的多个所述交易表征值,以及映射后多个所述累积样本数量进行拟合,获得所述特征维度对应的特征评分模型。
[0029]本申请实施例中,通过累计分布函数将候选交易数据映射到一个框架后,对映射后的多个交易表征值,以及映射后多个累积样本数量进行拟合,获得特征维度对应的特征评分模型,使得模型泛化能力强,计算简便,开发上线时效性高,能够满足大部分初级的特征量化工作,提升效率。
[0030]可选地,所述基于所述至少一个特征维度的特征评分值,获得所述待评估对象的初步评估分值,包括:
[0031]针对一个特征维度,将所述一个特征维度的特征评分值,作为所述待评估对象的初步评估分值;
[0032]针对多个特征维度,对所述多个特征维度的特征评分值进行加权求和,获得所述待评估对象的初步评估分值。
[0033]本申请实施例中,不同的特征维度对交易水平的影响不同,通过对多个特征维度
的特征评分值进行横向加权求和,得到初步评估分值,可以有效提高评分的准确性。
[0034]可选地,所述基于所述待评估对象的初步评估分值和所述待评估对象的历史评估分值,获得所述待评估对象在所述当前周期的综合评估分值,包括:
[0035]获取所述待评估对象在过去至少一个周期内的历史评估分值;
[0036]对所述待评估对象的初步评估分值,以及所述过去至少一个周期内的历史评估分值进行加权求和,获得所述待评估对象在所述当前周期的综合评估分值。
[0037]本申请实施例中,通过对待评估对象的当前周期和历史周期的评估分值进行纵向加权求和,得到待评估对象的综合评估分值,避免了因为时间的特殊性而导致综合评估分值不准确的问题,提高了评分的准确性。
[0038]一方面,本申请实施例提供了一种交易数据处理装置,该装置包括:
[0039]获取模块,用于获取当前周期内待评估对象在至少一个特征维度的交易特征;
[0040]确定模块,用于针对每个特征维度,基于所述特征维度对应的特征评分模型,以及所述特征维度的交易特征,确定所述特征维度的特征评分值,所述特征评分模型是通过数据拟合获得的;
[0041]处理模块,还用于基于所述至少一个特征维度的特征评分值,获得所述待评估对象的初步评估分值;
[0042]所述处理模块,还用于基于所述待评估对象的初步评估分值和所述待评估对象的历史评估分值本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种交易数据处理方法,其特征在于,包括:获取当前周期内待评估对象在至少一个特征维度的交易特征;针对每个特征维度,基于所述特征维度对应的特征评分模型,以及所述特征维度的交易特征,确定所述特征维度的特征评分值,所述特征评分模型是通过数据拟合获得的;基于所述至少一个特征维度的特征评分值,获得所述待评估对象的初步评估分值;基于所述待评估对象的初步评估分值和所述待评估对象的历史评估分值,获得所述待评估对象在所述当前周期的综合评估分值。2.根据权利要求1所述的方法,其特征在于,所述特征评分模型是通过数据拟合获得的,包括:针对每个特征维度,获取多个样本对象在所述特征维度的原始交易数据;对所述原始交易数据中的异常交易数据进行剔除,获得候选交易数据;对所述候选交易数据进行分箱处理,获得所述特征维度的样本特征数据;基于所述特征维度的样本特征数据进行数据拟合,获得所述特征维度对应的特征评分模型。3.根据权利要求2所述的方法,其特征在于,所述对所述原始交易数据中的异常交易数据进行剔除,获得候选交易数据,包括:对所述原始交易数据进行划分,并基于划分结果,从所述原始交易数据中获得第一个分位数和最后一个分位数;基于所述第一个分位数和所述最后一个分位数,确定所述原始交易数据的筛选阈值;对所述原始交易数据中大于所述筛选阈值的异常交易数据进行剔除,获得候选交易数据。4.根据权利要求2所述的方法,其特征在于,所述对所述候选交易数据进行分箱处理,获得所述特征维度的样本特征数据,包括:将所述候选交易数据划分为多个区间段的子交易数据;针对每个区间段,将所述区间段的中心值,作为所述区间段的子交易数据的交易表征值;以及,基于所述区间段内的子交易数据和位于所述区间段之前的历史区间段内的子交易数据,统计所述区间段对应的累积样本数量;将所述多个区间段各自对应的子交易数据的交易表征值,以及所述多个区间段各自对应的累积样本数量映射至预设数值区间内,获得所述特征维度的样本特征数据。5.根据权利要求4所述的方法,...
【专利技术属性】
技术研发人员:赵杰,李爱林,王瑞明,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。