基于标题和段落语义关联的协同过滤素材推荐方法及系统技术方案

技术编号:41796087 阅读:27 留言:0更新日期:2024-06-24 20:20
本发明专利技术公开了一种基于标题和段落语义关联的协同过滤素材推荐方法及系统,方法包括采集用户数据建立语料库;对语料库语料进行分词与清洗,生成语料库词向量;对用户输入关键词进行分词与清洗,通过语料库词向量对关键词进行向量化,生成输入文本句向量;计算输入文本词向量和素材标题词向量的相似度,获得相似度排名前若干个候选素材标题;将相似度前若干个候选素材标题输入完成训练的图神经网络的协同过滤模型,分别得到排名前若干个段落素材;根据段落素材生成推荐列表。本发明专利技术通过协同过滤的方法将一级推荐扩展为二级推荐是可行的,且在这一过程中或许可以降低推荐任务的用时,减少参与计算的素材数量。

【技术实现步骤摘要】

本专利技术涉及协同过滤素材推荐领域,尤其涉及一种基于标题和段落语义关联的协同过滤素材推荐及系统。


技术介绍

1、目前,主流的推荐算法主要分为三类:基于内容的推荐算法、协同过滤推荐算法和混合推荐算法。最经典是协同过滤推荐算法,它通过用户的历史行为分析用户偏好,建模用户特征,为用户推荐感兴趣的项目。

2、传统的协同过滤算法生成的特征向量信息量稀少,一般采用one-hot的方法生成特征向量,其中仅包含了用户/项目的编号这一个信息,且此时用户、项目被割裂看待,导致模型学习到的特征受到限制。


技术实现思路

1、为解决现有技术中存在的技术问题,本专利技术提供了一种基于标题和段落语义关联的协同过滤素材推荐方法及系统,具体技术方案如下所述:

2、根据本专利技术的一方面,一种基于标题和段落语义关联的协同过滤素材推荐方法,包括以下步骤:

3、s1、采集用户数据建立语料库;

4、s2、对语料库语料进行分词与清洗,通过word2vec模型对分词清洗后的语料进行训练生成语料库词向量,所述本文档来自技高网...

【技术保护点】

1.一种基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,

3.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,还包括根据步骤S2分词与清洗后的语料库词向量文本构建数据集,所述数据集包括素材标题、素材段落、训练样本和测试样本,具体包括:

4.根据权利要求1或2所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,步骤S2中通过word2vec模型对分词清洗后的语料进行训练生成词向量,具体包括:

5...

【技术特征摘要】

1.一种基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,

3.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,还包括根据步骤s2分词与清洗后的语料库词向量文本构建数据集,所述数据集包括素材标题、素材段落、训练样本和测试样本,具体包括:

4.根据权利要求1或2所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,步骤s2中通过word2vec模型对分词清洗后的语料进行训练生成词向量,具体包括:

【专利技术属性】
技术研发人员:李锦夏振涛李艳朱立烨夏鸿斌
申请(专利权)人:永中软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1