【技术实现步骤摘要】
本专利技术涉及协同过滤素材推荐领域,尤其涉及一种基于标题和段落语义关联的协同过滤素材推荐及系统。
技术介绍
1、目前,主流的推荐算法主要分为三类:基于内容的推荐算法、协同过滤推荐算法和混合推荐算法。最经典是协同过滤推荐算法,它通过用户的历史行为分析用户偏好,建模用户特征,为用户推荐感兴趣的项目。
2、传统的协同过滤算法生成的特征向量信息量稀少,一般采用one-hot的方法生成特征向量,其中仅包含了用户/项目的编号这一个信息,且此时用户、项目被割裂看待,导致模型学习到的特征受到限制。
技术实现思路
1、为解决现有技术中存在的技术问题,本专利技术提供了一种基于标题和段落语义关联的协同过滤素材推荐方法及系统,具体技术方案如下所述:
2、根据本专利技术的一方面,一种基于标题和段落语义关联的协同过滤素材推荐方法,包括以下步骤:
3、s1、采集用户数据建立语料库;
4、s2、对语料库语料进行分词与清洗,通过word2vec模型对分词清洗后的语料进行训练生
...【技术保护点】
1.一种基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,
3.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,还包括根据步骤S2分词与清洗后的语料库词向量文本构建数据集,所述数据集包括素材标题、素材段落、训练样本和测试样本,具体包括:
4.根据权利要求1或2所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,步骤S2中通过word2vec模型对分词清洗后的语料进行训练生成词向量,具体包
5...
【技术特征摘要】
1.一种基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,
3.根据权利要求1所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,还包括根据步骤s2分词与清洗后的语料库词向量文本构建数据集,所述数据集包括素材标题、素材段落、训练样本和测试样本,具体包括:
4.根据权利要求1或2所述的基于标题和段落语义关联的协同过滤素材推荐方法,其特征在于,步骤s2中通过word2vec模型对分词清洗后的语料进行训练生成词向量,具体包括:
【专利技术属性】
技术研发人员:李锦,夏振涛,李艳,朱立烨,夏鸿斌,
申请(专利权)人:永中软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。