【技术实现步骤摘要】
数据处理方法及装置
[0001]本专利技术涉及大数据领域,特别涉及一种数据处理方法及装置。
技术介绍
[0002]客户与不同银行的粘度以通过该客户在不同银行的存贷款类指标比较分析解决。但是,银行一般仅能获取到客户在本行的存贷款类指标数据,而无法获取该客户在其他银行的同类数据,因此直接通过存贷款类指标数据量化客户与各家银行的粘度的准确度不高。
技术实现思路
[0003]鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种数据处理方法及装置。
[0004]第一方面,一种数据处理方法,包括:
[0005]获得第一客户的同名账户之间的转账数据,其中,所述转账数据记录有对手方银行的标识;
[0006]对所述转账数据进行清洗和分组,其中,所述对手方银行的标识相同的转账数据划分为同一组,所述对手方银行的标识不相同的转账数据划分为不同组;
[0007]针对任一所述转账数据,根据所述转账数据的交易时间和当前时间,确定所述转账数据对应的时间衰减因子;
[0008]针对任一所述转账数据,根据所述转账数据记录的交易金额和对应的所述时间衰减因子,确定所述转账数据对应的修正金额;
[0009]针对任一所述转账数据,根据所述转账数据记录的交易次数和对应的所述时间衰减因子,确定所述转账数据对应的修正次数;
[0010]针对任一组所述转账数据,根据对应的各所述修正金额,计算得到对应的交易总金额和对应的净流出金额;
[0011]针对任一组所述转账数据 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获得第一客户的同名账户之间的转账数据,其中,所述转账数据记录有对手方银行的标识;对所述转账数据进行清洗和分组,其中,所述对手方银行的标识相同的转账数据划分为同一组,所述对手方银行的标识不相同的转账数据划分为不同组;针对任一所述转账数据,根据所述转账数据的交易时间和当前时间,确定所述转账数据对应的时间衰减因子;针对任一所述转账数据,根据所述转账数据记录的交易金额和对应的所述时间衰减因子,确定所述转账数据对应的修正金额;针对任一所述转账数据,根据所述转账数据记录的交易次数和对应的所述时间衰减因子,确定所述转账数据对应的修正次数;针对任一组所述转账数据,根据对应的各所述修正金额,计算得到对应的交易总金额和对应的净流出金额;针对任一组所述转账数据,根据对应的各所述修正次数,计算得到对应的交易总次数和对应的净流出次数;针对任一组所述转账数据,根据对应的所述交易总金额、所述净流出金额、所述交易总次数和所述净流出次数,确定所述第一客户与对应的所述对手方银行之间的关联度。2.根据权利要求1所述的方法,其特征在于,所述对所述转账数据进行清洗和分组,包括:根据各所述转账数据的对手方银行的标识,对各所述转账数据进行分组,其中,所述对手方银行的标识相同的转账数据划分为同一组,所述对手方银行的标识不相同的转账数据划分为不同组;针对所述对手方银行的标识为本行标识的转账数据,保留交易方向为借方的转账数据并删除对应的交易方向为贷方的转账数据,其中,所述交易方向为所述转账数据中记录的字段信息。3.根据权利要求1所述的方法,其特征在于,所述针对任一所述转账数据,根据所述转账数据的交易时间和当前时间,确定所述转账数据对应的时间衰减因子,包括:针对任一所述转账数据,根据公式确定所述转账数据对应的时间衰减因子,其中,所述W为所述时间衰减因子,所述pow为指数函数,所述v
set
为预设的衰减速率,所述T
set
为预设的衰减周期,所述day
diff
为所述转账数据的交易时间和当前时间的差的绝对值。4.根据权利要求1所述的方法,其特征在于,所述针对任一所述转账数据,根据所述转账数据记录的交易金额和对应的所述时间衰减因子,确定所述转账数据对应的修正金额,包括:针对任一所述转账数据,计算所述转账数据记录的交易金额和对应的所述时间衰减因子之间的乘积,得到所述修正金额;所述针对任一所述转账数据,根据所述转账数据记录的交易次数和对应的所述时间衰减因子,确定所述转账数据对应的修正次数,包括:
所述针对任一所述转账数据,计算所述转账数据记录的交易次数和对应的所述时间衰减因子之间的乘积,得到所述修正次数。5.根据权利要求1所述的方法,其特征在于,所述针对任一组所述转账数据,根据对应的各所述修正金额,计算得到对应的交易总金额和对应的净流出金额,包括:针对任一组所述转账数据,计算对应的各所述修正金额的第一总和,得到对应的所述交易总金额;针对任一组所述转账数据,计算相应交易方向为借方的转账数据对应的各所述修正金额的第二总和,并计算相应交易方向为贷方的转账数据对应的各所述修正金额的第三总和;针对任一组所述转账数据,计算对应的所述第二总和与所述第三总和的差,得到对应的所述净流出金额。6.根据权利要求1所述的方法,其特征在于,所述针对任一组所述转账数据,根据对应的各所述修正次数,计算得到对应的交易总次数和对应的净流出次数,包括:针对任一组所述转账数据,计算对应的各所述修正次数的第四总和,得到对应的所述交易总次数;针对任一组所述转账数据,计算相应交易方向为借方的转账数据对应的各所述修正次数的第五总和,并计算相应交易方向为贷方的转账数据对应的各所述修正次数的第六总和;针对任一组所述转账数据,计算对应的所述第五总和与所述第六总和的差,得到对应的所述净流出次数。7.根据权利要求1所述的方法,其特征在于,所述针对任一组所述转账数据,根据对应的所述交易总金额、所述净流出金额、所述交易总次数和所述净流出次数,确定所述第一客户与对应的...
【专利技术属性】
技术研发人员:兰舒,刘颖,吴倩倩,聂宇达,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。