【技术实现步骤摘要】
数据处理方法、推荐方法、装置、电子设备以及介质
[0001]本公开涉及人工智能
,尤其涉及数据处理、智能搜索
,具体涉及数据处理方法、推荐方法、装置、电子设备、存储介质以及程序产品。
技术介绍
[0002]随着信息技术和网络技术的迅猛发展,数据资源的膨胀与冗余给人们的社会活动和娱乐活动带来了选择的困惑。从海量数据资源中寻找需要的内容具有挑战。利用互联网的推荐服务,可以从海量数据资源中挖掘出用户感兴趣的内容并进行推荐,从而节省用户搜索的时间和精力,提高数据资源的获取效率。
技术实现思路
[0003]本公开提供了一种数据处理方法、推荐方法、装置、电子设备、存储介质以及程序产品。
[0004]根据本公开的一方面,提供了一种数据处理方法,包括:将预定历史时间段划分为至少一个时间窗;基于增量更新,针对所述至少一个时间窗中的每个时间窗,确定行为评估矩阵,其中,所述行为评估矩阵中的元素指示了一个用户针对一个对象的关注度,所述增量更新包括基于所述每个时间窗中至少一个时间段中的每个时间段的结束时刻,根据用户 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:将预定历史时间段划分为至少一个时间窗;基于增量更新,针对所述至少一个时间窗中的每个时间窗,确定行为评估矩阵,其中,所述行为评估矩阵中的元素指示了一个用户针对一个对象的关注度,所述增量更新包括基于所述每个时间窗中至少一个时间段中的每个时间段的结束时刻,根据用户针对对象已经完成的预定关注操作来更新所述行为评估矩阵;基于所述行为评估矩阵,确定所述每个时间窗的任意两个对象之间的相似度,得到所述每个时间窗的相似度矩阵;以及基于与所述至少一个时间窗一一对应的至少一个相似度矩阵,确定所述预定历史时间段内的任意两个对象之间的对象相似度。2.根据权利要求1所述的方法,其中,所述基于增量更新,针对所述至少一个时间窗中的每个时间窗确定所述行为评估矩阵包括:确定与所述每个时间窗的第i时间段的结束时刻相对应的行为评估矩阵,其中,T为时间窗的时长,T
S
为时间段的时长;确定针对所述第i+1时间段的结束时刻用户针对对象已经完成预定关注操作的行为评估变化数据;以及在所述第i+1时间段的结束时刻在所述每个时间窗的结束时刻之前的情况下,基于与所述第i时间段的结束时刻相对应的行为评估矩阵以及所述行为评估变化数据,确定与所述第i+1时间段的结束时刻相对应的行为评估矩阵,作为针对所述每个时间窗的行为评估矩阵。3.根据权利要求1所述的方法,其中,所述基于与所述至少一个时间窗口一一对应的至少一个相似度矩阵,确定所述预定历史时间段内的任意两个对象之间的对象相似度包括:分别确定所述相似度矩阵中的第a对象和第b对象的创建时间,其中,a∈{1,2,...,J
‑
1,J},b∈{1,2,...,J
‑
1,J},a≠b,J为所述相似度矩阵中的对象的总数量;基于所述第a对象的创建时间和所述第b对象的创建时间,确定目标时间窗,其中,所述目标时间窗为同时创建了所述第a对象和所述第b对象的起始时间窗;以及利用置信度区间上界的确定方式确定在所述目标时间窗至所述预定历史时间段的结束时刻,所述第a对象和所述第b对象之间的综合相似度,作为所述对象相似度。4.根据权利要求3所述的方法,其中,所述利用置信度区间上界的确定方式确定在所述目标时间窗至所述预定历史时间段的结束时刻,所述第a对象和所述第b对象之间的综合相似度,作为所述对象相似度包括:确定在所述目标时间窗至所述预定历史时间段的结束时刻,所述第a对象和所述第b对象之间的第一平均相似度;确定针对所述第一平均相似度的探索度;基于所述第一平均相似度与所述探索度,确定所述综合相似度,作为所述对象相似度。5.根据权利要求3所述的方法,其中,所述利用置信度区间上界的确定方式确定在所述目标时间窗至所述预定历史时间段的结束时刻,所述第a对象和所述第b对象之间的综合相
似度,作为所述对象相似度包括:基于指数近因加权平均的置信度区间上界的确定方式,确定在所述目标时间窗至所述预定历史时间段的结束时刻,所述第a对象和所述第b对象之间的综合相似度,作为所述对象相似度。6.根据权利要求5所述的方法,其中,所述基于指数近因加权平均的置信度区间上界的确定方式,确定在所述目标时间窗至所述预定历史时间段的结束时刻,所述第a对象和所述第b对象之间的综合相似度,作为所述对象相似度包括:基于所述每个时间窗的相似度矩阵,确定所述目标时间窗至所述预定历史时间段的结束时刻之间的每个时间窗的所述第a对象和所述第b对象的时间窗相似度;确定所述目标时间窗至所述预定历史时间段的结束时刻之间的每个时间窗的所述第a对象和所述第b对象的时间窗相似度的权重;基于所述每个时间窗的所述第a对象和所述第b对象之间的时间窗相似度和所述权重,确定所述目标时间窗至所述预定历史时间段的结束时刻,所述第a对象和所述第b对象的第二平均相似度;确定针对所述第二平均相似度的探索度;以及基于所述第二平均相似度与所述探索度,确定所述综合相似度,作为所述对象相似度。7.根据权利要求1所述的方法,还包括:确定初始样本集,其中,所述初始样本集中包括多个初始用户和多个初始对象,其中,所述多个初始用户针对所述多个初始对象执行过预定关注操作;确定所述多个初始对象中的每个初始对象的属性特征;基于所述每个初始对象的属性特征,确定所述多个初始对象中的任意两个初始对象之间的内容相似度;以及在所述内容相似度大于或等于预定相似度阈值的情况下,将与所述内容相似度大于或等于预定相似度阈值的初始对象作为对象,将与所述对象对应的初始用户作为用户。8.根据权利要求1所述的方法,还包括:获取新创建的新对象;确定所述新对象的属性特征;基于所述新对象的属性特征,确定与所述新对象相匹配的多个关联对象;以及将所述新对象和所述多个关联对象作为所述对象。9.一种推荐方法,包括:响应于推荐请求,确定目标用户的历史关注对象,其中,所述历史关注对象为所述目标用户在预定历史时间段内执行预定关注操作的对象;以及基于对象相似度,确定多个候选对象中与所述历史关注对象相匹配的目标推荐对象;其中,所述对象相似度是利用根据权利要求1至8任一项所述的数据处理方法得到的。10.一种数据处理装置,包括:划分模块,用于将预定历史时间段划分为至少一个时间窗;更新模块,用于基于增量更新,针对所述至少一个时间窗中的每个时间窗,确定行为评估矩阵,其中,所述行为评估矩阵中的元素指示了一个用户针对一个对象的关注度,所述增量更新包括基于所述每个时间窗中至少一个时间段中的每个时间段的结束时刻,根据用户
针对对象已经完成的预定...
【专利技术属性】
技术研发人员:苗晨曦,刘晓庆,谭云飞,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。