数据处理方法、装置、电子设备、存储介质和程序产品制造方法及图纸

技术编号:32915123 阅读:9 留言:0更新日期:2022-04-07 12:06
本公开提供了一种数据处理方法、装置、电子设备、存储介质及程序产品,涉及计算机技术领域。该方法包括:获取目标媒体内容对应的历史使用数据;历史使用数据包括单位时间使用量序列;根据单位时间使用量序列对目标媒体内容的未来使用量进行第一预测处理,得到第一预测使用量;获取目标时间区间,并确定目标时间区间对应的目标时间使用量和目标时间使用占比;根据目标时间使用量和目标时间使用占比对未来使用量进行第二预测处理,得到第二预测使用量;根据第一预测使用量与第二预测使用量确定目标预测使用量。本公开可以有效解决由于数据量少、波动性大且数据特征不一致所导致的预测不准确的问题,提高了数据预测的准确性。提高了数据预测的准确性。提高了数据预测的准确性。

【技术实现步骤摘要】
数据处理方法、装置、电子设备、存储介质和程序产品


[0001]本公开涉及计算机
,尤其涉及数据处理方法、数据处理装置、电子设备、计算机可读存储介质以及计算机程序产品。

技术介绍

[0002]随着互联网技术的快速发展,人们通过网络获取到信息内容越来越丰富,例如,用户可以通过网络获取到文本、图像、视频等各种类型的信息。以用户浏览的短视频为例,短视频中可以包含多种类型的元素,如原始视频、艺术字、动画、特效、魔法表情等多种类型的视频元素。
[0003]在一些应用场景中,短视频服务平台可能利用用户针对上述视频元素的历史使用数据对用户未来使用这些视频元素的行为进行预测,从而提前确定出用户比较感兴趣的视频元素。

技术实现思路

[0004]本公开提供一种数据处理方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,以至少解决相关技术中由于目标媒体内容的已有使用数据具有数量小、波动大、前后数据特征不一致等特点而导致无法对未来使用数据进行准确预测的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种数据处理方法,包括:获取目标媒体内容对应的历史使用数据;历史使用数据包括用户过去使用目标媒体内容所对应的单位时间使用量序列;根据单位时间使用量序列对目标媒体内容的未来使用量进行第一预测处理,得到第一预测使用量;获取目标时间区间,并确定目标时间区间对应的目标时间使用量和目标时间使用占比;目标时间区间为预设周期中的部分时间段;根据目标时间使用量和目标时间使用占比,对未来使用量进行第二预测处理,以得到第二预测使用量;根据第一预测使用量与第二预测使用量确定目标预测使用量。
[0006]在本公开的一种示例性实施例中,历史使用数据包含多个预设周期,根据单位时间使用量序列对目标媒体内容的未来使用量进行第一预测处理,得到第一预测使用量,包括:根据多个预设周期对单位时间使用量序列进行数据聚合处理,以得到各预设周期分别对应的周期使用量;获取预测子周期集合;预测子周期集合包括多个候选预测子周期;根据多个周期使用量与各候选预测子周期分别对未来最近一个预设周期的使用量进行预测,得到多个使用量预测值;根据多个使用量预测值确定目标预测子周期,以根据目标预测子周期进行第一预测处理,得到第一预测使用量。
[0007]在本公开的一种示例性实施例中,根据多个使用量预测值确定目标预测子周期,包括:确定使用量预测值对应的使用量实际值;分别确定各使用量预测值与对应的使用量实际值之间的方差,作为初始使用量方差;从多个初始使用量方差中确定最小使用量方差,将最小使用量方差对应的候选预测子周期作为目标预测子周期。
[0008]在本公开的一种示例性实施例中,根据目标预测子周期进行第一预测处理,得到第一预测使用量,包括:确定用于进行第一预测处理的目标预测函数;根据目标预测子周期与目标预测函数进行第一预测处理,以得到第一预测使用量。
[0009]在本公开的一种示例性实施例中,确定目标时间区间对应的目标时间使用量与目标时间使用占比,包括:获取历史使用数据中包含的多个预设周期的周期使用量;确定各预设周期在目标时间区间分别对应的目标时间使用量;根据多个目标时间使用量与多个预设周期的周期使用量确定目标时间使用占比。
[0010]在本公开的一种示例性实施例中,根据多个目标时间使用量与多个预设周期的周期使用量确定目标时间使用占比,包括:确定各预设周期对应的初始使用占比;初始使用占比根据各预设周期的目标时间使用量与各自对应的后一预设周期的周期使用量的比例确定;根据多个初始使用占比确定目标时间使用占比。
[0011]在本公开的一种示例性实施例中,根据第一预测使用量与第二预测使用量确定目标预测使用量,包括:确定第一预测使用量对应的第一预测离散度与第二预测使用量对应的第二预测离散度;根据第一预测离散度与第二预测离散度确定融合可信度;根据第一预测使用量、第二预测使用量与融合可信度确定目标预测使用量。
[0012]在本公开的一种示例性实施例中,确定第一预测使用量对应的第一预测离散度与第二预测使用量对应的第二预测离散度,包括:获取历史最近预设周期对应的实际使用量;获取历史最近预设周期对应的第一预测量与第二预测量;第一预测量为通过第一预测处理得到的预测使用量,第二预测量为通过第二预测处理得到的预测使用量;根据第一预测量与实际使用量确定第一预测离散度;根据第二预测量与实际使用量确定第二预测离散度。
[0013]根据本公开实施例的第二方面,提供一种数据处理装置,包括:历史数据获取模块,被配置为执行获取目标媒体内容对应的历史使用数据;历史使用数据包括用户过去使用目标媒体内容所对应的单位时间使用量序列;第一预测模块,被配置为执行根据单位时间使用量序列对目标媒体内容的未来使用量进行第一预测处理,得到第一预测使用量;使用占比确定模块,被配置为执行确定目标时间区间,并确定目标时间区间对应的目标时间使用量和目标时间使用占比;目标时间区间为预设周期中的部分时间段;第二预测模块,被配置为执行根据目标时间使用量和目标时间使用占比对未来使用量进行第二预测处理,以得到第二预测使用量;融合预测模块,被配置为执行根据第一预测使用量与第二预测使用量确定目标预测使用量。
[0014]在本公开的一种示例性实施例中,第一预测模块包括第一预测单元,第一预测单元被配置为执行:根据多个预设周期对单位时间使用量序列进行数据聚合处理,以得到各预设周期分别对应的周期使用量;获取预测子周期集合;预测子周期集合包括多个候选预测子周期;根据多个周期使用量与各候选预测子周期分别对未来最近一个预设周期的使用量进行预测,得到多个使用量预测值;根据多个使用量预测值确定目标预测子周期,以根据目标预测子周期进行第一预测处理,得到第一预测使用量。
[0015]在本公开的一种示例性实施例中,第一预测单元包括预测子周期确定子单元,预测子周期确定子单元被配置为执行:确定使用量预测值对应的使用量实际值;分别确定各使用量预测值与对应的使用量实际值之间的方差,作为初始使用量方差;从多个初始使用量方差中确定最小使用量方差,将最小使用量方差对应的候选预测子周期作为目标预测子
周期。
[0016]在本公开的一种示例性实施例中,第一预测单元包括第一预测子单元,第一预测子单元被配置为执行:确定用于进行第一预测处理的目标预测函数;根据目标预测子周期与目标预测函数进行第一预测处理,以得到第一预测使用量。
[0017]在本公开的一种示例性实施例中,使用占比确定模块包括使用占比确定单元,占比确定单元被配置为执行:获取历史使用数据中包含的多个预设周期的周期使用量;确定各预设周期在目标时间区间分别对应的目标时间使用量;根据多个目标时间使用量与多个预设周期的周期使用量确定目标时间使用占比。
[0018]在本公开的一种示例性实施例中,使用占比确定单元包括占比确定子单元,占比确定子单元被配置为执行:确定各预设周期对应的初始使用占比;初始使用占比根据各预设周期的目标时间使用量与各自对应的后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取目标媒体内容对应的历史使用数据;所述历史使用数据包括用户过去使用所述目标媒体内容所对应的单位时间使用量序列;根据所述单位时间使用量序列对所述目标媒体内容的未来使用量进行第一预测处理,得到第一预测使用量;获取目标时间区间,并确定所述目标时间区间对应的目标时间使用量和目标时间使用占比;所述目标时间区间为预设周期中的部分时间段;根据所述目标时间使用量和所述目标时间使用占比,对所述未来使用量进行第二预测处理,以得到第二预测使用量;根据所述第一预测使用量与所述第二预测使用量确定目标预测使用量。2.根据权利要求1所述的方法,其特征在于,所述历史使用数据包含多个预设周期,所述根据所述单位时间使用量序列对所述目标媒体内容的未来使用量进行第一预测处理,得到第一预测使用量,包括:根据多个所述预设周期对所述单位时间使用量序列进行数据聚合处理,以得到各所述预设周期分别对应的周期使用量;获取预测子周期集合;所述预测子周期集合包括多个候选预测子周期;根据多个所述周期使用量与各所述候选预测子周期分别对未来最近一个预设周期的使用量进行预测,得到多个使用量预测值;根据多个所述使用量预测值确定目标预测子周期,以根据所述目标预测子周期进行第一预测处理,得到所述第一预测使用量。3.根据权利要求2所述的方法,其特征在于,所述根据多个所述使用量预测值确定目标预测子周期,包括:确定所述使用量预测值对应的使用量实际值;分别确定各所述使用量预测值与对应的所述使用量实际值之间的方差,作为初始使用量方差;从多个所述初始使用量方差中确定最小使用量方差,将所述最小使用量方差对应的候选预测子周期作为所述目标预测子周期。4.根据权利要求1所述的方法,其特征在于,所述确定所述目标时间区间对应的目标时间使用量和目标时间使用占比,包括:获取所述历史使用数据中包含的多个预设周期的周期使用量;确定各所述预设周期在所述目标时间区间分别对应的所述目标时间使用量;根据多个所述目标时间使用量与多个所述预设周期的周期使用量确定所述目标时间使用占比。5.根据权利要求1所述的方法,其特征在于,所述根据所述第一预测使用量与所述第二预测使用量确定目标预测使用量,...

【专利技术属性】
技术研发人员:何立伟林建立
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1