文章推荐方法、文章推荐装置、电子设备、存储介质制造方法及图纸

技术编号:34851133 阅读:23 留言:0更新日期:2022-09-08 07:51
本申请提供一种文章推荐方法、文章推荐装置、电子设备、存储介质,包括:获取预设时间范围内目标对象的点击数据和目标对象对应的信息;根据目标对象的点击数据获取目标对象的点击文章;根据目标对象的信息和目标对象的点击文章建立第一关系列表;提取点击文章的多个点击关键词;根据第一关系列表和多个点击关键词建立第二关系列表;根据点击文章的浏览历史从第一关系列表中确定第三关系列表;对第二关系列表和第三关系列表进行组合处理,得到点击文章的召回列表;根据召回列表生成点击文章对应的文章推荐结果。本申请根据目标对象的点击数据得到召回列表,使召回列表中的召回文章与目标对象的点击数据相关,能够提高线上召回的效果。果。果。

【技术实现步骤摘要】
文章推荐方法、文章推荐装置、电子设备、存储介质


[0001]本申请涉及人工智能
,尤其涉及一种文章推荐方法、文章推荐装置、电子设备、存储介质。

技术介绍

[0002]相关技术中,基于局部敏感哈希算法进行文章推荐,通过提取网站中已发布的每篇文章的标题和内容关键词,将标题和内容关键词输入word2vec模型生成文章对应的词向量,利用距离计算公式计算词向量之间的距离,并根据距离获取与当前词向量最近的多个其他词向量,获取这多个其他词向量对应的文章用于召回,这种召回方式原理较为简单,线上召回效果差。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种文章推荐方法、文章推荐装置、电子设备、存储介质,能够使召回的文章与目标对象的点击数据相关联,提高线上召回的效果。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种文章推荐方法,所述方法包括:
[0005]获取预设时间范围内目标对象的点击数据和所述目标对象对应的信息;
[0006]根据所述目标对象的点击数据获取所述目标对象的点击文章;
[0007]根据所述目标对象的信息和所述目标对象的点击文章建立第一关系列表,所述第一关系列表用于表征所述目标对象与所述点击文章之间的关系;
[0008]对所述点击文章进行分词处理,得到所述点击文章的多个词语,根据所述词语在所述点击文章的词频和逆文档频率,从多个所述词语中提取所述点击文章的多个点击关键词;
[0009]根据所述第一关系列表和多个所述点击关键词建立第二关系列表,所述第二关系列表用于表征所述目标对象与所述点击关键词之间的关系;
[0010]根据所述点击文章的浏览历史从所述第一关系列表中确定第三关系列表,所述第三关系列表用于表征所述点击文章和根据所述点击文章的浏览历史确定的目标对象之间的关系;
[0011]从所述第二关系列表中获取第三关系列表中目标对象对应的点击关键词,将所述第三关系列表中目标对象对应的点击关键词作为目标关键词,对所述第三关系列表中的点击文章和所述目标关键词进行组合处理,得到所述点击文章的召回列表;
[0012]根据所述召回列表生成所述点击文章对应的文章推荐结果。
[0013]在一些实施例,所述根据所述目标对象的信息和所述目标对象的点击文章建立第一关系列表,包括:
[0014]计算所述目标对象在对应的所述点击文章的点击频次;
[0015]根据所述点击频次对多个所述点击文章进行排序,得到排序后的点击文章;
[0016]对所述排序后的点击文章进行筛选,从所述排序后的点击文章中提取出目标点击文章;
[0017]根据所述目标对象的信息和所述目标点击文章建立第一关系列表。
[0018]在一些实施例,所述根据所述第一关系列表和多个所述点击关键词建立第二关系列表,包括:
[0019]计算多个所述点击关键词在所述点击文章中的出现频次;
[0020]根据所述出现频次对多个所述点击关键词进行筛选,从多个所述点击关键词中提取出目标点击关键词;
[0021]根据所述第一关系列表和所述目标点击关键词建立第二关系列表。
[0022]在一些实施例,所述从所述第二关系列表中获取第三关系列表中目标对象对应的点击关键词,将所述第三关系列表中目标对象对应的点击关键词作为目标关键词,对所述第三关系列表中的点击文章和所述目标关键词进行组合处理,得到所述点击文章的召回列表,包括:
[0023]从所述第二关系列表中获取第三关系列表中目标对象对应的点击关键词,将所述第三关系列表中目标对象对应的点击关键词作为目标关键词,对所述第三关系列表中的点击文章和所述目标关键词进行组合处理,得到第四关系列表,所述第四关系列表用于表征所述点击文章与所述目标关键词之间的关系;
[0024]将所述第四关系列表输入预设的语义识别模型,根据所述语义识别模型对所述第四关系列表进行向量化处理,得到所述点击文章对应的目标嵌入向量;
[0025]根据所述目标嵌入向量得到所述点击文章的召回列表。
[0026]在一些实施例,所述将所述第四关系列表输入预设的语义识别模型,根据所述语义识别模型对所述第四关系列表进行向量化处理,得到所述点击文章对应的目标嵌入向量,包括:
[0027]获取全量内容表;
[0028]提取所述全量内容表中的发布文章和所述发布文章对应的内容关键词;
[0029]根据所述发布文章和所述内容关键词建立第五关系列表,所述第五关系列表用于表征所述发布文章与所述内容关键词之间的关系;
[0030]将所述第四关系列表和所述第五关系列表进行组合处理,得到组合关系列表;
[0031]对所述组合关系列表进行去重处理,得到目标关系列表;
[0032]将所述目标关系列表输入预设的语义识别模型,根据所述语义识别模型对所述目标关系列表进行向量化处理,得到所述点击文章对应的目标嵌入向量。
[0033]在一些实施例,所述根据所述目标嵌入向量得到所述点击文章的召回列表,包括:
[0034]根据局部敏感哈希算法计算所述目标嵌入向量与其他嵌入向量的相似度,所述其他嵌入向量为除了所述点击文章以外其他文章对应的嵌入向量;
[0035]根据所述相似度计算所述目标嵌入向量的目标邻向量;
[0036]获取所述目标邻向量对应的召回文章;
[0037]根据所述召回文章得到所述点击文章的召回列表。
[0038]在一些实施例,所述召回列表被存储于预设数据库中,所述根据所述召回列表生成所述点击文章对应的文章推荐结果,包括:
[0039]响应于对所述点击文章的点击操作,从所述预设数据库中获取所述点击文章对应的所述召回列表;
[0040]获取所述召回列表中召回文章的打分数值;
[0041]根据所述打分数值对所述召回文章进行筛选,从所述召回文章中提取出目标召回文章;
[0042]根据所述目标召回文章生成所述点击文章对应的所述文章推荐结果。
[0043]本申请实施例的第二方面提出了一种文章推荐装置,所述装置包括:
[0044]第一获取模块,用于获取预设时间范围内目标对象的点击数据和所述目标对象对应的信息;
[0045]第二获取模块,用于根据所述目标对象的点击数据获取所述目标对象的点击文章;
[0046]第一关系列表模块,用于根据所述目标对象的信息和所述目标对象的点击文章建立第一关系列表,所述第一关系列表用于表征所述目标对象与所述点击文章之间的关系;
[0047]关键词提取模块,用于对所述点击文章进行分词处理,得到所述点击文章的多个词语,根据所述词语在所述点击文章的词频和逆文档频率,从多个所述词语中提取所述点击文章的多个点击关键词;
[0048]第二关系列表模块,用于根据所述第一关系列表和多个所述点击关键词建立第二关系列表,所述第二关系列表用于表征所述目标对象与所述点击关键词之间的关系;...

【技术保护点】

【技术特征摘要】
1.文章推荐方法,其特征在于,所述方法包括:获取预设时间范围内目标对象的点击数据和所述目标对象对应的信息;根据所述目标对象的点击数据获取所述目标对象的点击文章;根据所述目标对象的信息和所述目标对象的点击文章建立第一关系列表,所述第一关系列表用于表征所述目标对象与所述点击文章之间的关系;对所述点击文章进行分词处理,得到所述点击文章的多个词语,根据所述词语在所述点击文章的词频和逆文档频率,从多个所述词语中提取所述点击文章的多个点击关键词;根据所述第一关系列表和多个所述点击关键词建立第二关系列表,所述第二关系列表用于表征所述目标对象与所述点击关键词之间的关系;根据所述点击文章的浏览历史从所述第一关系列表中确定第三关系列表,所述第三关系列表用于表征所述点击文章和根据所述点击文章的浏览历史确定的目标对象之间的关系;从所述第二关系列表中获取第三关系列表中目标对象对应的点击关键词,将所述第三关系列表中目标对象对应的点击关键词作为目标关键词,对所述第三关系列表中的点击文章和所述目标关键词进行组合处理,得到所述点击文章的召回列表;根据所述召回列表生成所述点击文章对应的文章推荐结果。2.根据权利要求1所述的文章推荐方法,其特征在于,所述根据所述目标对象的信息和所述目标对象的点击文章建立第一关系列表,包括:计算所述目标对象在对应的所述点击文章的点击频次;根据所述点击频次对多个所述点击文章进行排序,得到排序后的点击文章;对所述排序后的点击文章进行筛选,从所述排序后的点击文章中提取出目标点击文章;根据所述目标对象的信息和所述目标点击文章建立第一关系列表。3.根据权利要求1所述的文章推荐方法,其特征在于,所述根据所述第一关系列表和多个所述点击关键词建立第二关系列表,包括:计算多个所述点击关键词在所述点击文章中的出现频次;根据所述出现频次对多个所述点击关键词进行筛选,从多个所述点击关键词中提取出目标点击关键词;根据所述第一关系列表和所述目标点击关键词建立第二关系列表。4.根据权利要求1所述的文章推荐方法,其特征在于,所述从所述第二关系列表中获取第三关系列表中目标对象对应的点击关键词,将所述第三关系列表中目标对象对应的点击关键词作为目标关键词,对所述第三关系列表中的点击文章和所述目标关键词进行组合处理,得到所述点击文章的召回列表,包括:从所述第二关系列表中获取第三关系列表中目标对象对应的点击关键词,将所述第三关系列表中目标对象对应的点击关键词作为目标关键词,对所述第三关系列表中的点击文章和所述目标关键词进行组合处理,得到第四关系列表,所述第四关系列表用于表征所述点击文章与所述目标关键词之间的关系;将所述第四关系列表输入预设的语义识别模型,根据所述语义识别模型对所述第四关系列表进行向量化处理,得到所述点击文章对应的目标嵌入向量;
根据所述目标嵌入向量得到所述点击文章的召回列表。5.根据权利要求4所述的文章推荐方法,其特征在于,所述将所述第四关系列表输入预设的语义识别模型,根据所述语义识别模型对所述第四关系列表进行向量化处理,得到所述点击文章对应的目标嵌入向量,包括:获取全量内容表;提取所述全量内容表中的发布文章和所述发布文章对应的内容关键词...

【专利技术属性】
技术研发人员:易明
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1