【技术实现步骤摘要】
一种基于成熟度技术的文献推荐系统及方法
本专利技术涉及一种改进了内容推荐算法的文献推荐系统,属于推荐算法领域。
技术介绍
随着大数据技术和机器学习科学的发展,推荐系统被越来越多的引入各大网站和应用程序中,推荐的物品也越来越多地包罗万象,比如商品,书籍,电影,音乐等。一个好的推荐系统可以精确地找到用户的兴趣点并推荐用户喜欢的物品,大大增加了系统的点击率和用户的满意度。目前在对物品进行推荐时,最常采用的方法为协同过滤的推荐方法和基于内容的推荐方法,除此之外还有准确率比较高的矩阵分解的方法和一些基于图神经网络的方法。在众多推荐算法之中,基于内容的推荐算法是最为经典的推荐算法之一。基于内容的推荐算法主要包括以下四个步骤:1.根据用户的浏览、购买、点击等行为计算用户特征。2.根据物品的详细信息(如类别,型号等)计算物品特征。3.使用用户特征和物品特征计算用户和不同物品之间的匹配度。4.向用户推荐匹配度最高的物品。其中物品的特征统称为物品画像,人物的特征称为人物画像,物品画像和人物画像往往有几十甚 ...
【技术保护点】
1.一种基于成熟度技术的文献推荐方法,特征是,采用了基于内容的推荐算法的基本框架;首先通过机器学习的方法分析出每篇文献的主题类别,再根据用户的浏览记录找到用户感兴趣的主题,给用户推荐他所感兴趣的主题下的文献;再在这个基础上考虑到用户在他感兴趣的领域的学习程度,根据用户的学习程度为用户设定等级;再计算出每篇文献在它所属的领域属于什么程度的文献,通过计算机的方法对文献设定等级;最后结合用户的等级和文献本身的等级为用户推荐适合他等级的文献。/n
【技术特征摘要】
1.一种基于成熟度技术的文献推荐方法,特征是,采用了基于内容的推荐算法的基本框架;首先通过机器学习的方法分析出每篇文献的主题类别,再根据用户的浏览记录找到用户感兴趣的主题,给用户推荐他所感兴趣的主题下的文献;再在这个基础上考虑到用户在他感兴趣的领域的学习程度,根据用户的学习程度为用户设定等级;再计算出每篇文献在它所属的领域属于什么程度的文献,通过计算机的方法对文献设定等级;最后结合用户的等级和文献本身的等级为用户推荐适合他等级的文献。
2.一种基于成熟度技术的文献推荐系统,其特征在于,包括数据预处理模块、文献分类模块、计算文献等级模块、计算用户等级模块、生成各用户的推荐列表模块,其中:
数据预处理模块得到的数据有三部分,分别是每个用户的文献阅读顺序、文献的详细内容、文献的发布时间和好评率,其中用户的文献阅读顺序提供给计算文献等级模块和计算用户等级模块;文献的详细内容提供给文献分类模块;
文献分类模块的输入是各种主题的技术文献详细内容,输出是所有文献和该文献的主题,将该输出提供给计算文献等级模块;在文献主题分类时使用了文本向量空间模型,这是一种词袋模式,不考虑词的先后顺序,然后使用TFIDF统计加权技术对文献内的各个词语求权重,并且使用word2vec方法来对所有的词语进行分类;使用新的向量来表示词语;获得每篇文献的所有权重前K大的词语之后,文献之间可以两两求得相似度;使用KNN的方法对文献进行聚类操作,把所有的文献一共分为K类,K的大小取决于文献库的体量,每个分类即一个主题;
计算文献等级模块的输入是各个文献及它们的主题以及用户的文献阅读顺序,输出是各个...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。