一种新闻推荐方法及装置制造方法及图纸

技术编号:11383576 阅读:37 留言:0更新日期:2015-05-01 08:35
本发明专利技术实施例公开了一种新闻推荐方法及装置,包括:获取多个新闻中的目标新闻中的各个词语在目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含目标新闻中的指定词语的新闻数量;根据目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,分别计算多个新闻的特征向量;根据多个新闻中待推荐新闻的特征向量以及所述多个新闻中用户已阅读新闻的特征向量,确定待推荐新闻与用户已阅读新闻的相似度;若所述待推荐新闻与所述用户已阅读新闻的相似度大于预设阈值,则对所述待推荐新闻进行推荐。采用本发明专利技术实施例,可以提高新闻推荐的精确性。

【技术实现步骤摘要】

本专利技术涉及电子
,尤其涉及一种新闻推荐方法及装置
技术介绍
网络已成为一种为人们提供快捷便利信息资源的主要手段,但互联网的飞速发展产生了信息过载问题,解决信息超载问题一个非常有潜力的办法是推荐系统,它可以根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户,满足用户的个性化需求。智能推荐系统充分运用了机器学习、数据挖掘、自然语言处理等相关领域的技术。推荐系统现已广泛应用于很多领域,其中典型应用有新闻推荐。新闻推荐可以帮助用户快速找到符合自己兴趣的新闻,因此有必要在海量的新闻数据和用户之间找到其中的关联以精准地推荐。
技术实现思路
本专利技术提供一种新闻推荐方法及装置。可以提高新闻推荐的精确性。本专利技术提供了一种新闻推荐方法,包括:获取多个新闻中的目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量;根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,分别计算所述多个新闻的特征向量;根据所述多个新闻中待推荐新闻的特征向量以及所述多个新闻中用户已阅读新闻的特征向量,确定所述待推荐新闻与所述用户已阅读新闻的相似度;若所述待推荐新闻与所述用户已阅读新闻的相似度大于预设阈值,则对所述待推荐新闻进行推荐。其中,所述根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,分别计算所述多个新闻的特征向量包括:根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,计算所述指定词语在所述目标新闻中的词频以及所述指定词语在所述多个新闻中的词频;将所述指定词语在所述目标新闻中的词频乘以所述指定词语在所述多个新闻中的词频,计算得到所述指定词语在所述目标新闻中的关键值;根据所述指定词语在所述目标新闻中的关键值,确定所述目标新闻的特征向量。其中,所述根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,计算所述指定词语在所述目标新闻中的词频以及所述指定词语在所述多个新闻中的词频包括:根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,计算所述目标新闻中的各个词语在目标新闻中的出现次数之和;计算所述目标新闻中的指定词语在所述目标新闻中的出现次数与所述目标新闻中的各个词语在目标新闻中的出现次数之和的比值得到所述指定词语在所述目标新闻中的词频。其中,所述指定词语在所述多个新闻中的词频其中,D为所述多个新闻的新闻总数,T为所述多个新闻中包含所述目标新闻中的指定词语的新闻数量。其中,所述根据所述指定词语在所述目标新闻中的关键值,确定所述目标新闻的特征向量包括:根据所述目标新闻中各个词语在所述目标新闻中的关键值,从所述目标新闻中的各个词语中选择预设个数的词语;根据所述选择的预设个数的词语分别对应的关键值,生成得到所述目标新闻的特征向量。其中,所述根据所述多个新闻中待推荐新闻的特征向量以及所述多个新闻中用户已阅读新闻的特征向量,确定所述待推荐新闻与所述用户已阅读新闻的相似度包括:计算所述待推荐新闻的特征向量与所述多个新闻中用户已阅读新闻的特征向量之间的余弦值;将所述待推荐新闻的特征向量与所述多个新闻中用户已阅读新闻的特征向量之间的余弦值作为所述待推荐新闻与所述用户已阅读新闻的相似度。相应地,本专利技术提供了另一种新闻推荐方法,包括:根据多个新闻之间的相互转移次数,建立所述多个新闻之间的频率转移矩阵;将所述多个新闻之间的频率转移矩阵生成得到所述多个新闻的关联度排布表,所述关联度排布表包括所述多个新闻中的目标新闻分别转移到所述多个新闻中的其他新闻的次数;根据所述关联度排布表,确定所述多个新闻之间的转移比值;根据所述多个新闻之间的转移比值,从所述多个新闻中确定推送的新闻。其中,所述根据所述关联度排布表,确定所述多个新闻之间的转移比值包括:计算所述目标新闻转移到所述其他新闻中的第一新闻的次数与所述目标新闻转移到所述其他新闻中的第二新闻的次数的比值得到所述多个新闻之间的转移比值,所述目标新闻转移到所述第一新闻的次数与所述目标新闻转移到所述第二新闻的次数在所述关联度排布表中相邻排列。其中,所述根据所述多个新闻之间的转移比值,从所述多个新闻中确定推送的新闻包括:若所述目标新闻转移到所述第一新闻的次数与所述目标新闻转移到所述第二新闻的次数的比值大于预设比值,则推送所述第一网页。相应地,本专利技术提供了一种新闻推荐装置,包括:数量获取模块,用于获取多个新闻中的目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量;向量计算模块,用于根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,分别计算所述多个新闻的特征向量;相似度确定模块,用于根据所述多个新闻中待推荐新闻的特征向量以及所述多个新闻中用户已阅读新闻的特征向量,确定所述待推荐新闻与所述用户已阅读新闻的相似度;新闻推荐模块,用于若所述待推荐新闻与所述用户已阅读新闻的相似度大于预设阈值,则对所述待推荐新闻进行推荐。其中,所述向量计算模块包括:词频计算单元,用于根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,计算所述指定词语在所述目标新闻中的词频以及所述指定词语在所述多个新闻中的词频;关键值计算单元,用于将所述指定词语在所述目标新闻中的词频乘以所述指定词语在所述多个新闻中的词频,计算得到所述指定词语在所述目标新闻中的关键值;向量确定单元,用于根据所述指定词语在所述目标新闻中的关键值,确定所述目标新闻的特征向量。其中,所述根词频计算单元具体用于:根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,计算所述目标新闻中的各个词语在目标新闻中的出现本文档来自技高网...

【技术保护点】
一种新闻推荐方法,其特征在于,所述方法包括:获取多个新闻中的目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量;根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数量,分别计算所述多个新闻的特征向量;根据所述多个新闻中待推荐新闻的特征向量以及所述多个新闻中用户已阅读新闻的特征向量,确定所述待推荐新闻与所述用户已阅读新闻的相似度;若所述待推荐新闻与所述用户已阅读新闻的相似度大于预设阈值,则对所述待推荐新闻进行推荐。

【技术特征摘要】
1.一种新闻推荐方法,其特征在于,所述方法包括:
获取多个新闻中的目标新闻中的各个词语在所述目标新闻中的出现次数,
所述多个新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语
的新闻数量;
根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个
新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数
量,分别计算所述多个新闻的特征向量;
根据所述多个新闻中待推荐新闻的特征向量以及所述多个新闻中用户已阅
读新闻的特征向量,确定所述待推荐新闻与所述用户已阅读新闻的相似度;
若所述待推荐新闻与所述用户已阅读新闻的相似度大于预设阈值,则对所
述待推荐新闻进行推荐。
2.如权利要求1所述的方法,其特征在于,所述根据所述目标新闻中的各
个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个
新闻中包含所述目标新闻中的指定词语的新闻数量,分别计算所述多个新闻的
特征向量包括:
根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,所述多个
新闻的新闻总数以及所述多个新闻中包含所述目标新闻中的指定词语的新闻数
量,计算所述指定词语在所述目标新闻中的词频以及所述指定词语在所述多个
新闻中的词频;
将所述指定词语在所述目标新闻中的词频乘以所述指定词语在所述多个新
闻中的词频,计算得到所述指定词语在所述目标新闻中的关键值;
根据所述指定词语在所述目标新闻中的关键值,确定所述目标新闻的特征
向量。
3.如权利要求2所述的方法,其特征在于,所述根据所述目标新闻中的各
个词语在所述目标新闻中的出现次数,所述多个新闻的新闻总数以及所述多个
新闻中包含所述目标新闻中的指定词语的新闻数量,计算所述指定词语在所述

\t目标新闻中的词频以及所述指定词语在所述多个新闻中的词频包括:
根据所述目标新闻中的各个词语在所述目标新闻中的出现次数,计算所述
目标新闻中的各个词语在目标新闻中的出现次数之和;
计算所述目标新闻中的指定词语在所述目标新闻中的出现次数与所述目标
新闻中的各个词语在目标新闻中的出现次数之和的比值得到所述指定词语在所
述目标新闻中的词频。
4.如权利要求2所述的方法,其特征在于,所述指定词语在所述多个新
闻中的词频其中,D为所述多个新闻的新闻总数,T为所述多个
新闻中包含所述目标新闻中的指定词语的新闻数量。
5.如权利要求2所述的方法,其特征在于,所述根据所述指定词语在所述
目标新闻中的关键值,确定所述目标新闻的特征向量包括:
根据所述目标新闻中各个词语在所述目标新闻中的关键值,从所述目标新
闻中的各个词语中选择预设个数的词语;
根据所述选择的预设个数的词语分别对应的关键值,生成得到所述目标新
闻的特征向量。
6.如权利要求1所述的方法,其特征在于,所述根据所述多个新闻中待推
荐新闻的特征向量以及所述多个新闻中用户已阅读新闻的特征向量,确定所述
待推荐新闻与所述用户已阅读新闻的相似度包括:
计算所述待推荐新闻的特征向量与所述多个新闻中用户已阅读新闻的特征
向量之间的余弦值;
将所述待推荐新闻的特征向量与所述多个新闻中用户已阅读新闻的特征向
量之间的余弦值作为所述待推荐新闻与所述用户已阅读新闻的相似度。
7.一种新闻推荐方法,其特征在于,所述方法包括:
根据多个新闻之间的相互转移次数,建立所述多个新闻之间的频率转移矩
阵;
将所述多个新闻之间的频率转移矩阵生成得到所述多个新闻的关联度排布
表,所述关联度排布表包括所述多个新闻中的目标新闻分别转移到所述多个新
闻中的其他新闻的次数;
根据所述关联度排布表,确定所述多个新闻之间的转移比值;
根据所述多个新闻之间的转移比值,从所述多个新闻中确定推送的新闻。
8.如权利要求7所述的方法,其特征在于,所述根据所述关联度排布表,
确定所述多个新闻之间的转移比值包括:
计算所述目标新闻转移到所述其他新闻中的第一新闻的次数与所述目标新
闻转移到所述其他新闻中的第二新闻的次数的比值得到所述多个新闻之间的转
移比值,所述目标新闻转移到所述第一新闻的次数与所述目标新闻转移到所述
第二新闻的次数在所述关联度排布表中相邻排列。
9.如权利要求8所述的方法,其特征在于,所述根据所述多个新闻之间的
转...

【专利技术属性】
技术研发人员:周丰丰葛瑞泉周曼丽仲任姚瞾旻赵苗苗
申请(专利权)人:深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1