一种数据处理方法、装置及存储介质制造方法及图纸

技术编号:37270298 阅读:10 留言:0更新日期:2023-04-20 23:39
本发明专利技术公开了一种数据处理方法、装置及存储介质,方法包括:获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问目标类型信息产生的行为数据,确定为第二行为数据;基于第一行为数据,确定目标类型信息对应的全局偏好度;基于第二行为数据,确定目标类型信息对应的个体偏好度;基于全局偏好度和个体偏好度,确定目标对象对目标类型信息的实际偏好度。通过上述技术方案,提高了偏好度确定的准确性。确性。确性。

【技术实现步骤摘要】
一种数据处理方法、装置及存储介质


[0001]本申请涉及信息处理
,尤其涉及一种数据处理方法、装置及存储介质。

技术介绍

[0002]目前,电信运营商作为移动网络和有限网络的主要运营商之一,积累了大量的用户上网行为数据,为了给用户带来更好的用户体验,为用户推荐合适的产品或音视频内容,需要了解用户的上网偏好并将用户的上网偏好进行量化,根据用户对不同类型的偏好程度,实时不同的推荐策略。
[0003]现有的用户上网偏好的度量一般通过采集用户历史上网的多个指标,进行加权,得到用户的长期上网偏好,或者,将采集的用户历史上网行为指标根据时间远近进行衰减,得到用户的上网偏好,但是,用户的上网偏好往往会受到很多外部的因素,比如,内容的质量,最近流行的内容,并且随着时间的推移,用户的上网偏好会产生变化,因此,利用上述偏好度量方案确定的用户上网偏好,准确性较低。

技术实现思路

[0004]为解决上述技术问题,本专利技术实施例期望提供一种数据处理方法、装置及存储介质,针对单一用户对某一类型信息偏好度的确定,不仅利用了该用户对该类型数据的个体偏好,还结合了所有用户对该类型信息的全局偏好度,从而提高了偏好度确定的准确性。
[0005]本专利技术的技术方案是这样实现的:
[0006]本专利技术提供了一种数据处理方法,所述方法包括:
[0007]获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问所述目标类型信息产生的行为数据,确定为第二行为数据
[0008]基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度;
[0009]基于所述第二行为数据,确定所述目标类型信息对应的个体偏好度;
[0010]基于所述全局偏好度和所述个体偏好度,确定所述目标对象对所述目标类型信息的实际偏好度。
[0011]在上述方法中,所述基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度,包括:
[0012]按照第一预设单位时间段,将所述预设时长划分为多个第一时间段;
[0013]将所述第一行为数据中,所述多个第一时间段中每个第一时间段内产生的行为数据划分为一组行为数据,得到多组行为数据;
[0014]根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量;
[0015]基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度。
[0016]在上述方法中,所述根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量,包括:
[0017]根据第一组行为数据包括的多个访问次数确定访问平均次数,并基于所述多个访问次数和所述访问平均次数,确定访问次数标准差;其中,所述第一组行为数据为所述多组行为数据中目标时间段对应的行为数据,所述目标时间段为所述多个第一时间段中任一时间段;所述多个访问次数中每个访问次数为不同访问对象对所述目标类型信息在所述目标时间段内的访问次数;
[0018]利用所述访问平均次数和所述访问次数标准差,对所述多个访问次数中每个访问次数进行标准化处理,得到与所述多个访问次数一一对应的多个访问次数标准值;
[0019]将所述多个访问次数标准值之和,确定为所述目标时间段内所述目标类型信息的访问总次数;
[0020]根据所述第一组行为数据包括的多个访问流量确定访问平均流量,并基于所述多个访问流量和所述访问平均流量,确定访问流量标准差;所述多个访问流量中每个访问流量为不同访问对象对所述目标类型信息在所述目标时间段内的访问流量;
[0021]利用所述访问平均流量和所述访问流量标准差,对所述多个访问流量中每个访问流量进行标准化处理,得到与所述多个访问流量一一对应的多个访问流量标准值;
[0022]将所述多个访问流量标准值之和,确定为所述目标时间段内所述目标类型信息的访问总流量。
[0023]在上述方法中,所述基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度,包括:
[0024]针对所述多个第一时间段中每个第一时间段,将时间段内所述目标类型信息的访问总次数和访问总流量之和确定为对应的访问总值;
[0025]针对所述多个第一时间段中每个第一时间段,将对应的访问总值与预设衰减因子之积,确定为对应的阶段偏好度;
[0026]将所述多个第一时间段中不同时间段对应的阶段偏好度之和,确定为所述全局偏好度。
[0027]在上述方法中,所述基于所述第二行为数据,确定所述目标类型信息对应的个体偏好度,包括:
[0028]从所述预设时长内确定出目标时长,并将所述第二行为数据中,所述目标时长内所述目标对象访问所述目标类型信息产生的行为数据确定为目标行为数据;
[0029]将所述目标行为数据包括的所述目标对象对所述目标类型信息在所述目标时长内的访问次数和访问流量之和,确定为所述目标对象对所述目标类型信息的短期偏好度;
[0030]基于所述第二行为数据,确定所述目标对象对所述目标类型信息的长期偏好度;
[0031]将所述短期偏好度与第一预设权重因子之积,确定为第一偏好度,并将所述长期偏好度与第二预设权重因子的之积,确定为第二偏好度;
[0032]将所述第一偏好度与所述第二偏好度之和,确定为所述个体偏好度。
[0033]在上述方法中,所述基于所述第二行为数据,确定所述目标对象对目标类型信息的长期偏好度,包括:
[0034]按照第二预设单位时间段,将所述预设时长划分为多个第二时间段;
[0035]将所述第二行为数据中,所述多个第二时间段中每个第二时间段产生的行为数据划分为一组行为数据,得到多组目标行为数据;
[0036]针对所述多个第二时间段中每个第二时间段,将所述多组目标行为数据中每组目标行为数据包括的访问次数和访问流量之和,确定为对应的访问数值;
[0037]针对所述多个第二时间段中每个第二时间段,将对应的访问数值与预设衰减因子之积,确定为对应的历史偏好度;
[0038]将所述多个第二时间段中不同时间段对应的历史偏好度之和,确定为所述长期偏好度。
[0039]在上述方法中,所述基于所述全局偏好度和所述个体偏好度,确定所述目标对象对所述目标类型信息的实际偏好度,包括:
[0040]将所述全局偏好度与第三预设权重因子之积,确定为第三偏好度,并将所述个体偏好度与第四预设权重因子的之积,确定为第四偏好度;
[0041]将所述第三偏好度与所述第四偏好度之和,确定为所述实际偏好度。
[0042]本专利技术提供了一种数据处理装置,包括:
[0043]获取模块,用于获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问所述目标类型信息产生的行为数据,确定为第二行为数据;基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度;基于所述第二行为数据,确定所述目标类型信息对应的个体偏好度;基于所述全局偏好度和所述个体偏好度,确定所述目标对象对所述目标类型信息的实际偏好度。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度,包括:按照第一预设单位时间段,将所述预设时长划分为多个第一时间段;将所述第一行为数据中,所述多个第一时间段中每个第一时间段内产生的行为数据划分为一组行为数据,得到多组行为数据;根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量;基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度。3.根据权利要求2所述的方法,其特征在于,所述根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量,包括:根据第一组行为数据包括的多个访问次数确定访问平均次数,并基于所述多个访问次数和所述访问平均次数,确定访问次数标准差;其中,所述第一组行为数据为所述多组行为数据中目标时间段对应的行为数据,所述目标时间段为所述多个第一时间段中任一时间段;所述多个访问次数中每个访问次数为不同访问对象对所述目标类型信息在所述目标时间段内的访问次数;利用所述访问平均次数和所述访问次数标准差,对所述多个访问次数中每个访问次数进行标准化处理,得到与所述多个访问次数一一对应的多个访问次数标准值;将所述多个访问次数标准值之和,确定为所述目标时间段内所述目标类型信息的访问总次数;根据所述第一组行为数据包括的多个访问流量确定访问平均流量,并基于所述多个访问流量和所述访问平均流量,确定访问流量标准差;所述多个访问流量中每个访问流量为不同访问对象对所述目标类型信息在所述目标时间段内的访问流量;利用所述访问平均流量和所述访问流量标准差,对所述多个访问流量中每个访问流量进行标准化处理,得到与所述多个访问流量一一对应的多个访问流量标准值;将所述多个访问流量标准值之和,确定为所述目标时间段内所述目标类型信息的访问总流量。4.根据权利要求2所述的方法,其特征在于,所述基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度,包括:针对所述多个第一时间段中每个第一时间段,将时间段内所述目标类型信息的访问总次数和访问总流量之和确定为对应的访问总值;
针对所述多个第一时间段中每个第一时间段,将对应的访问总值与预设衰减因子之积,确定为对应的阶段偏好度;将所述多个第一时间段中不同时间段对应的阶段偏好度之和,确定为所述全局偏好...

【专利技术属性】
技术研发人员:黄治移翁旭东刘妍妍梅铮郭建军
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1