【技术实现步骤摘要】
基于多偏好度的项目推荐方法及系统
[0001]本专利技术属于数据挖掘与项目推荐
,特别涉及基于多偏好度的项目推荐方法及系统。
技术介绍
[0002]随着互联网的发展,软硬件技术的逐步成熟和应用场景的丰富,越来越多数据通过各种终端产生并服务于人们的工作与生活。海量数据的产生带来了信息过载的问题,互联网上的信息也越来越丰富和多样,人们可以在网络上获得各种各样的信息和服务,同时人们逐渐发现要在网上找到符合自己需求的东西也越来越麻烦,早期搜索技术可以满足人们这一需求,但是由于它的结果不够个性化不能满足不同用户的个人偏好需求,因此个性化推荐技术开始被发现并应用于各个领域,推荐系统也尝试利用各种算法挖掘用户的个性化偏好,使得提出一种满足用户需求的推荐系统变得至关重要。
[0003]推荐算法的本质是通过一定的方式将用户和项目联系起来,现有技术致力于提高推荐的准确率,而忽略了推荐的多样性问题。但是在实际推荐环境中,准确率并不是提高用户对推荐项目满意度的唯一标准,推荐课程的多样性也是一个重要指标。对于在线教育领域,个性化推荐技术 ...
【技术保护点】
【技术特征摘要】
1.基于多偏好度的项目推荐方法,其特征在于,包括以下步骤:S1:构建在线教育的课程数据库,所述课程数据库用于存储在线教育资源并记录所述在线教育资源的描述文本,所述描述文本包括所述在线教育资源的属性数据及学习历史;S2:信息采集模块采集用户在在线教育系统上的学习数据,所述学习数据包括用户的注册信息、浏览学习的行为、对课程的评分、评论及历史学习课程;通过LDA模型对所述评论进行主题提取;S3:将所述学习数据输入偏好度分析模块,分析用户对课程的兴趣偏好度、课程的用户偏好度、用户与用户之间的相似度及课程与课程之间的相似度,所述偏好度分析模块包括兴趣偏好度分析模块、用户偏好度分析模块、用户相似度分析模块及课程相似度分析模块;S4:融合所述用户对课程的兴趣偏好度、课程的用户偏好度、用户与用户之间的相似度及课程与课程之间的相似度,计算每个用户与课程的推荐指数,对于任一用户,课程按照推荐指数降序排列,依据设定的数量依序选择若干课程加入推荐列表。2.根据权利要求1所述的基于多偏好度的项目推荐方法,其特征在于,所述评论通过LDA模型提取出用户对课程隐含的主题以及课程本身的属性特征,所述LDA模型首先以概率分布的形式给出所有用户的所有评论中每篇评论的主题出现概率,然后分析归类为同一主题下的评论抽取实际主题,根据主题分布进行主题聚类,将每个用户的所有评论文本得到的主题分布进行加权平均得到该用户最终的兴趣主题分布,将每个课程得到的所有评论文本的主题分布进行加权平均得到该课程的特征主题分布;根据所述特征主题分布,计算任意两项课程的主题相似度T(a,b):T(a,b)=ω
a1
ω
b1
+ω
a2
ω
b2
+
…
+ω
an
ω
bn
式中,ω
ai
为两项课程相同的第i项主题在课程a中的概率分布,ω
bi
为两项课程相同的第i项主题在课程b中的概率分布,n为任意两项课程相同主题的数量。3.根据权利要求2所述的基于多偏好度的项目推荐方法,其特征在于,所述LDA模型提取主题的步骤如下:S3
‑
1:在一篇评论中,以设定的概率从所述一篇评论的主题分布中选取一个主题;S3
‑
2:在已选取的主题所对应的词语分布中,以设定概率选取一个词语;S3
‑
3:重复步骤S3...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。