【技术实现步骤摘要】
一种基于神经网络的新闻推荐方法
本专利技术涉及网络上信息推荐
,尤其是涉及一种基于神经网络的新闻推荐方法。
技术介绍
随着万维网的广泛普及,大量新闻正在迅速出现,并且信息严重超载,因此用户别无选择。新闻推荐的出现减轻了信息过载,并帮助用户快速准确地获取他们感兴趣的新闻。当前,常用的推荐方法是基于内容的过滤(CB),协作过滤(CF)和混合方法。在新闻推荐领域,基于内容的推荐算法是基于对读者过去感兴趣的文档进行分析,以推荐更多相关文档。有研究者提出了一种基于内容的模型和余弦相似度搜索的快速新闻推荐方法,尽管该算法具有很高的解释性,并且没有冷启动的问题,但是在建议的多样性方面不足,因此难以挖掘用户的潜在偏好。与Google的新闻个性化系统类似,协作过滤取决于社区中的协作过滤和兴趣模式,而不管新闻文章的内容如何。有研究者提出了一种自适应用户分析模型,该模型将协作过滤应用于相似用户组阅读的新闻列表,并以传统方式将新闻视为项目,协作过滤算法需要积累用户的点击行为来进行推荐,从而导致用户冷启动的问题。混合推荐算法主要采用基于 ...
【技术保护点】
1.一种基于神经网络的新闻推荐方法,其特征在于,该推荐方法的步骤为,/nS1、获取原有数据库内部分的新闻信息及所有的用户信息;/nS2、利用FastText工具对获取的新闻信息中的标题与内容进行学习,获取固定长度的词向量并组成相应的词汇表;/nS3、对数据库内获取的新闻信息按照不同的用户信息进行人工标注,人工标注的标准为是否为该用户已经阅读的新闻信息,已经阅读的新闻信息为阅读新闻信息,未被阅读的新闻信息为候选新闻信息;/nS4、对获取的不同用户的阅读新闻信息与候选新闻信息,利用开源工具对标题与内容进行分词标注;/nS5、将已经人工标注及分词标注的新闻信息组成新闻数据集,将获 ...
【技术特征摘要】
1.一种基于神经网络的新闻推荐方法,其特征在于,该推荐方法的步骤为,
S1、获取原有数据库内部分的新闻信息及所有的用户信息;
S2、利用FastText工具对获取的新闻信息中的标题与内容进行学习,获取固定长度的词向量并组成相应的词汇表;
S3、对数据库内获取的新闻信息按照不同的用户信息进行人工标注,人工标注的标准为是否为该用户已经阅读的新闻信息,已经阅读的新闻信息为阅读新闻信息,未被阅读的新闻信息为候选新闻信息;
S4、对获取的不同用户的阅读新闻信息与候选新闻信息,利用开源工具对标题与内容进行分词标注;
S5、将已经人工标注及分词标注的新闻信息组成新闻数据集,将获取的用户信息组成用户数据集,对新闻数据集及用户数据集进行整理和预处理,得到训练集与测试集,训练集由阅读新闻信息及用户信息组成,测试集由候选新闻信息与用户信息组成;
S6、对步骤S5中训练集进行训练,得到新闻信息的推荐模型;
S7、在步骤S6生成的推荐模型中输入候选新闻信息,对候选新闻信息是否被用户点击进行概率的预测,得到测试集的精度。
2.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述的用户信息包括用户自己感兴趣的新闻类别、用户朋友感兴趣的新闻类别以及用户与朋友之间的亲密程度。
3.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述步骤S2中词向量的维度为50、100、128和200中的一种。
4.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,在所述步骤S3中阅读新闻信息人工标注为1,候选新闻信息人工标注为0。
5.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述的步骤S4中的开源工具为Jieba工具。
6.根据权利要求1所述的基于网络的新闻推荐方法,其特征在于,所述步骤S5中的训练集由9/10的新闻数据集的数据及用户数据集的数据组成,所述的测试集由1/10的新闻数...
【专利技术属性】
技术研发人员:罗轶凤,朱鹏,
申请(专利权)人:苏州遐迩信息技术有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。