【技术实现步骤摘要】
用于帖子召回的方法、计算设备和存储介质
[0001]本公开的实施例总体涉及信息处理领域,具体涉及用于帖子召回的方法、计算设备和计算机存储介质。
技术介绍
[0002]传统的用于帖子召回的方案例如包括两种:一种是基于用户画像的帖子的召回方法,另一种是基于用户协同过滤(User
‑
CF)的算法进行帖子召回的方法。对于前者,由于用户行为数据通常较为稀疏,难以准确形成用户画像以用于召回帖子。对于后者的协同过滤算法,由于模型仅能学习到用户针对帖子的点赞或关注等行为的一级关系,因此学习能力不理想,所召回的帖子的数量较少并且相关性较低。
[0003]综上,传统的用于帖子召回的方案的不足之处在于,难以有效提高召回的高相关性的帖子的数量。
技术实现思路
[0004]提供了一种用于帖子召回的方法、计算设备以及计算机存储介质,能够有效提高召回的高相关性的帖子的数量。
[0005]根据本公开的第一方面,提供了一种用于帖子召回的方法。该方法包括:获取预定时间间隔内的用户针对帖子的第一互动行为数据、以及 ...
【技术保护点】
【技术特征摘要】
1.一种用于帖子召回的方法,包括:获取预定时间间隔内的用户针对帖子的第一互动行为数据、以及用户之间的第二互动行为数据、用户标识和帖子标识;基于第一互动行为数据、第二互动行为数据、用户标识和帖子标识,生成有向图,所述有向图指示多个用户节点、多个帖子节点、用于指示第一互动行为的用户节点到帖子节点的有向边、以及用于指示第二互动行为的用户节点之间的有向边;在所述有向图上,以顺着有向边方向和逆着有向边方向交替的方式随机游走,以便采集长度小于或者等于预定长度阈值的多个节点序列,以用于基于所述多个节点序列生成输入特征序列;利用预定尺寸的窗口滑过所述输入特征序列,以便生成多个子序列以用于训练神经网络模型;经由经训练的神经网络模型,生成用户嵌入表征向量和帖子嵌入表征向量,以便基于关于用户嵌入表征向量和帖子嵌入表征向量的相关度计算结果来召回关于当前用户的帖子。2.根据权利要求1所述的方法,其中在所述有向图上以顺着有向边方向和逆着有向边方向交替的方式随机游走,以便采集长度小于或者等于预定长度阈值的多个节点序列包括:针对用户节点到帖子节点的有向边的每种属性类型,从有向图中随机采样第一数量的长度不超过第一长度阈值的节点序列;以及针对用户节点之间的有向边的每种属性类型,从有向图中随机采样第二数量个长度不超过第二长度阈值的节点序列。3.根据权利要求1所述的方法,其中窗口的预定尺寸的是经由以下而确定的:响应于确定用户节点到帖子节点的有向边的属性类型为点击,确定窗口的预定尺寸为第一预定值,以及确定所述预定长度阈值为第一阈值;以及响应于确定用户节点到帖子节点的有向边的属性类型为评论或者点赞,确定窗口的预定尺寸为第二预定值,以及确定所述预定长度阈值为第二阈值,所述第二预定值大于所述第一预定值,所述第二阈值大于第一阈值。4.根据权利要求2所述的方法,其中针对用户节点到帖子节点的有向边的每种属性类型,从有向图中随机采样第一数量的长度不超过第一长度阈值的节点序列包括:确定是否游走至用户节点;响应于确定游走至用户节点,在用户节点所关联的多个出边中随机选择符合第一预定条件的一个出边,以便游走至所述出边顺着有向边方向所指向的目标帖子节点,来采集所述目标帖子节点的帖子标识以作为节点序列的数据,所述第一预定条件与用户节点到帖子节点的有向边的属性类型相关联;确定是否以下任一条件满足:节点序列的长度是否大于或者等于所述第一长度阈值;所述目标帖子节点不存在符合第一预定条件的入边;响应于确定上述条件均未满足,在所述目标帖子节点所关联的多个有向边的入边中随机选择符合第一预定条件的一个入边,以便转移至所述入边逆着有向边方向所指向的下一
用户节点。5.根据权利要求4所述的方法,其中针对用户节点到帖子节点的有向边的每种属性类型,从有向图中随机采样第一数量的长度不超过第一长度阈值的节点序列还包括:响应于确定游走至一帖子节点,在所述帖子节点所...
【专利技术属性】
技术研发人员:唐方爽,张璐,陶明,彭飞,唐文斌,
申请(专利权)人:上海任意门科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。