【技术实现步骤摘要】
数据填充方法、装置、电子设备及介质
[0001]本专利技术实施例涉及大数据领域,尤其涉及一种数据填充方法、装置、电子设备及介质。
技术介绍
[0002]在银行收单交易的流水中,一笔交易通常由很多变量决定:交易金额、交易时间、卡号、商户类型、商户号等。在描述一笔交易的时候,所使用的变量越多,通常对一笔交易的描述会更加准确。但是变量的增多也因为其描述的现象更加复杂,维度更多,又因其属性之间的相关性而导致分析难度倍增,同时由于数据的缺失,给数据分析带来一定的困扰,因此需要对数据进行填充。
[0003]目前的填充方案一般是通过判断缺失值前后数据是否缺失来预设缺失值个数进行填充,或者是当数据存在连续缺失,或者波动性较大的时候,采用现有方法取平均值进行填充,这种方案需要预设缺失值个数,计算效率低下,并且填充值的准确度很低,也无法利用变量之间的相关性来进行缺失值填充。
技术实现思路
[0004]本专利技术实施例中提供了一种数据填充方法、装置、电子设备及介质,以达到利用商户交易信息之间的相关性来进行数据填充,提升数据
【技术保护点】
【技术特征摘要】
1.一种数据填充方法,其特征在于,包括:确定预设时长内的商户交易数据矩阵;依据自注意力模块对所述商户交易数据矩阵进行数据填充,得到填充后的第一商户交易数据矩阵和第二商户交易数据矩阵;依据解码器对所述第一商户交易矩阵和第二商户交易矩阵进行解码,得到待分析商户交易流水数据。2.根据权利要求1所述的方法,其特征在于,确定预设时长内的商户交易数据矩阵,包括:获取预设时长内的商户交易单和每单交易对应的交易变量;依据所述商户交易单和所述交易变量确定商户交易数据矩阵。3.根据权利要求2所述的方法,其特征在于,所述商户交易数据矩阵中的行向量按商户交易单的时序进行排列,列向量按交易变量的类型进行排列。4.根据权利要求2所述的方法,其特征在于,所述交易变量包括:银行卡号、交易金额、交易时间、授权号、交易币种、商户号、商户名称、商户地址、商户类型中的至少一种。5.根据权利要求1所述的方法,其特征在于,依据自注意力模块对所述商户交易数据矩阵进行数据填充,得到填充后的第一商户交易数据矩阵和第二商户交易数据矩阵,包括:将所述商户交易数据矩阵输入变量注意力模块和时间注意力模块;分别从变量维度和时间维度对所述商户交易数据矩阵的缺失数据进行填充,得到填充后的第一商户交易数据矩阵和第二商户交易数据矩阵。6.根据权利要求5所述的方法,其特征在于,将所述商户交易数据矩阵输入变量注意力模块和时间注意力模块,包括:将所述商户交易数据矩阵进行转置得到转置商户交易数据矩阵;将所述商户交易数据矩阵输入变量注意力模块;将所述转置商户交易矩阵输入时间注意力模块。7.根据权利要求5所述的方法,其特征在于,分别从变量维度和时间维度对所述商户交易数据矩阵的...
【专利技术属性】
技术研发人员:匡海健,郑梓悫,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。