社区推荐及模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24498165 阅读:29 留言:0更新日期:2020-06-13 03:53
本申请公开了社区推荐及模型训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。具体实现方案为:采集用户的标识和所述用户的社区关注列表中的各社区的标识,作为用户数据;利用预先训练好的特征预测模型和所述用户数据,生成所述用户的特征表达;基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识;向所述用户推荐所述N个社区的标识。本申请能够准确地向用户推荐N个社区,有效地提高社区推荐的准确性。

Community recommendation and model training methods, devices, electronic equipment and storage media

【技术实现步骤摘要】
社区推荐及模型训练方法、装置、电子设备及存储介质
本申请涉及计算机
,尤其涉及人工智能,具体涉及社区推荐及模型训练方法、装置、电子设备及存储介质。
技术介绍
互联网发展到今天,社区类产品广泛性使用,每天占据用户较高的时长。且互联网用户基数巨大,各种兴趣社区层出不穷,随着时间演进,不断涌现出越来越多的社区。用户可以从社区中获取大量的信息。但是由于社区较多,导致用户无法筛选出自己最感兴趣的社区。基于此,现有的推荐方案可以帮助用户从大量的社区中找到用户真正感兴趣的社区。例如,现有的社区推荐方式可以采用排行榜单的方式。具体地,基于网站或者应用内的用户行为数据进行统计,在全局用户数据下选择最近一段时间窗口内比较热门、互动较强的社区进行推荐。但是现有的上述推荐方式推荐的社区并非用户真正想要关注的社区,导致社区推荐的准确性较差。
技术实现思路
为了解决上述技术问题,本申请提供一种社区推荐及模型训练方法、装置、电子设备及存储介质,用于提高社区推荐的准确性。一方面,本申请提供一种社区推荐方法,包括:采集用本文档来自技高网...

【技术保护点】
1.一种社区推荐方法,其特征在于,包括:/n采集用户的标识和所述用户的社区关注列表中的各社区的标识,作为用户数据;/n利用预先训练好的特征预测模型和所述用户数据,生成所述用户的特征表达;/n基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识;/n向所述用户推荐所述N个社区的标识。/n

【技术特征摘要】
1.一种社区推荐方法,其特征在于,包括:
采集用户的标识和所述用户的社区关注列表中的各社区的标识,作为用户数据;
利用预先训练好的特征预测模型和所述用户数据,生成所述用户的特征表达;
基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识;
向所述用户推荐所述N个社区的标识。


2.根据权利要求1所述的方法,其特征在于,基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识,包括:
从所述社区列表的社区特征表达库中获取与所述用户的特征表达相似度最大的N个社区的特征表达;
从所述社区列表中获取所述N个社区的特征表达对应的标识。


3.根据权利要求1或2所述的方法,其特征在于,基于所述用户的特征表达和预先生成的社区列表的社区特征表达库,从所述社区列表中获取与所述用户的特征表达相似度最大的N个社区的标识之前,所述方法包括:
采用预先训练好的特征表达模型,基于所述社区列表中各所述社区的标识,生成对应的社区特征表达;
基于所述社区列表中各所述社区的社区特征表达,构建所述社区特征表达库。


4.一种特征预测模型的训练方法,其特征在于,包括:
采集数条训练数据,各所述训练数据中包括训练用户的标识和所述训练用户的社区关注子列表中的各社区标识;
对于各所述训练数据,从所述社区关注子列表选择一个社区标识,作为标注数据;将所述训练用户的标识和所述社区关注子列表中其余的社区标识,作为输入数据;
采用各所述训练数据中的所述输入数据和所述标注数据,对特征预测模型进行训练。


5.根据权利要求4所述的方法,其特征在于,采集数条训练数据,包括:
挖掘各所述训练用户的标识和社区关注列表;
对于各所述训练用户的社区关注列表,按照移动滑动窗口的方式,依次从所述社区关注列表中截取预设数量的社区标识,构成社区关注子列表;并将对应的所述训练用户的标识和和所述社区关注子列表构成一条所述训练数据,共得到数条所述训练数据。


6.根据权利要求4或5所述的方法,其特征在于,采用各所述训练数据中的所述输入数据和所述标注数据,对特征预测模型进行训练,包括:
对于各所述训练数据,在嵌入层采用预先训练好的特征表达模型将所述输入数据中的所述训练用户的标识和各所述社区标识分别进行特征表达处理,得到对应的特征表达;
在操作层中,采用特征表达平均的方法,将所述输入数据中的所述训练用户的标识的特征表达和各所述社区标识对应特征表达进行操作,输出预测特征表达;
基于所述特征表达模型,获取所述标注数据中的所述社区标识对应的标注特征表达;
基于所述预测特征表达和标注特征表达,构建损失函数;
判断所述损失函数是否收敛;
若未收敛,调整所述特征预测模型中的参数,使得所述损失函数趋于收敛。


7.一种社区推荐装置,其特征在于,包括:
采集模块,用于采集用户的标识和所述用户的社区关注列表中的各社区的标识,作为用户数据;
生成模块,用于...

【专利技术属性】
技术研发人员:陈亮辉杨晓璇付琰彭炼钢
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1