数据信息缺失数据填充方法、装置、设备及介质制造方法及图纸

技术编号:34091470 阅读:54 留言:0更新日期:2022-07-11 21:17
本申请公开一种数据信息缺失数据填充方法、装置、设备及介质,其中,该方法包括:提取用户数据中的缺失数据,上述缺失数据为缺失特征信息的数据;遍历上述N组用户数据的N组用户交互序列数据,对目标用户交互序列数据进行计算,获取上述N组用户交互序列数据对应的关联权重集合;根据上述关联权重集合中的关联权重值,对上述X组目标交互序列用户数据中的每组目标用户交互序列数据进行计算,获取上述缺失数据的缺失特征信息对应的数据值;将上述缺失特征信息对应的数据值填补至上述用户数据中。如此,可以大幅度减少无关噪声,并且大幅度提高填补的精准度,从而在后续为用户推送更加符合用户需求的内容。合用户需求的内容。合用户需求的内容。

【技术实现步骤摘要】
数据信息缺失数据填充方法、装置、设备及介质


[0001]本专利技术实施例涉及数据分析领域,尤其是一种数据信息缺失数据填充方法、装置、设备及介质。

技术介绍

[0002]目前,随着电子技术和互联网技术的发展,人们通过电子设备可以随时随地方便的获取到各类互联网资讯内容。
[0003]除了主动获取互联网资讯内容,互联网平台也会主动向电子设备推送互联网资讯内容。在相关技术中,互联网平台会要求资讯内容的创作者对创作内容在上传平台之前进行维度信息的填写,从而平台会根据创作者填写的维度信息对该资讯内容进行分类,在平台向电子设备的用户进行资讯内容推送时,可以根据欲推送电子设备对应的用户画像与维度信息的匹配程度,从而向电子设备的用户推送给最准确的资讯内容。
[0004]当维度信息缺失时,平台会采取预设的模型算法进行预测或者均值填充,进而完成后续推送工作,然而,这种方式耗时较长,且模型算法在线实时更新困难,因此会大幅降低推送准确率,降低推送效率。

技术实现思路

[0005]本专利技术实施例提供一种根据单位时间窗口对用户数据进行计算,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据信息缺失数据填充方法,其特征在于,包括:提取用户数据中的缺失数据,所述缺失数据为缺失特征信息的数据,所述用户数据包括:用户信息数据、用户交互序列数据;将所述用户数据分为N组用户数据,所述N组用户数据中的每组用户数据对应一组用户信息,N为正整数;遍历所述N组用户数据的N组用户交互序列数据,对目标用户交互序列数据进行计算,获取所述N组用户交互序列数据对应的关联权重集合,所述目标用户交互序列数据为所述N组用户交互序列数据中的每组用户交互序列数据在单位时间窗口内对应的用户交互序列数据;根据所述关联权重集合中的关联权重值,对所述X组目标交互序列用户数据中的每组目标用户交互序列数据进行计算,获取所述缺失数据的缺失特征信息对应的数据值,所述X组目标用户数据包含所述缺失数据对应的缺失特征信息的数据;将所述缺失特征信息对应的数据值填补至所述用户数据中。2.根据权利要求1所述的方法,其特征在于,所述提取用户数据中的缺失数据,包括:确定所述用户数据对应的目标特征信息;查询所述用户数据的特征信息;比对所述目标特征信息和所述特征信息;确认所述用户数据中包含缺失特征信息的缺失数据。3.根据权利要求1所述的方法,其特征在于,所述将所述用户数据分为N组用户数据,包括:按照所述用户数据对应的用户信息,对所述用户数据的用户交互序列数据进行排序;生成N组用户数据,所述N组用户数据中的每组用户数据包括:所述每组用户数据对应的用户信息和所述每组用户数据对应的用户交互序列数据。4.根据权利要求1所述的方法,其特征在于,所述遍历所述N组用户数据的N组用户交互序列数据,对目标用户交互序列数据进行计算,获取所述N组用户交互序列数据对应的关联权重,包括:确定所述N组用户交互序列数据的单位时间窗口;对所述N组用户交互序列数据中单位时间窗口内的用户交互序列数据进行计算;获取所述用户交互序列数据中每个数据与其他数据对应的数据关系的关联权重,生成关联权重集合。5.根据权利要求4所述的方法,其特征在于,所述获取所述用户交互序列数据中每个数据与其他数据对应的数据关系的关联权重,生成关联权重集合中,所述方法包括:获取所述N组用户交互序列数据中每组用户交互序列数据中每个数据与其他数据之间的第一关联权重;根据所述第一关联权重计算,生成第二关联权重,所述第二关联权重用于表征所述用户交互序列数据中...

【专利技术属性】
技术研发人员:顾聪聪
申请(专利权)人:平安健康保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1