一种基于改进深度结构化语义模型的电影推荐系统及方法技术方案

技术编号:33848722 阅读:36 留言:0更新日期:2022-06-18 10:34
一种基于改进深度结构化语义模型的电影推荐系统,包括用户行为采集与处理模块、离线训练模块和在线召回与排序模块,所述用户行为采集与处理模块收集用户的互动行为,所述离线训练模块接收用户行为采集与处理模块输出的合并后的数据,所述在线召回与排序模块根据用户的属性特征中取出用户已经训练得出的用户特征向量,并采用近似最近邻搜索技术在电影向量库中召回为用户推荐的电影子集;一种基于改进深度结构化语义模型的电影推荐方法,包括用户行为采集和处理、离线训练、在线召回与排序等步骤,本发明专利技术可以根据用户与电影的显性特征和隐性交互信息,有效地挖掘出符合用户兴趣的电影,为用户提供个性化的推荐服务,得到该用户的推荐结果。户的推荐结果。户的推荐结果。

【技术实现步骤摘要】
一种基于改进深度结构化语义模型的电影推荐系统及方法


[0001]本专利技术涉及语意模型领域,具体是一种基于改进深度结构化语义模型的电影推荐系统及方法。

技术介绍

[0002]随着互联网不断发展,网络视频市场规模逐年增长。网络用户在享受形式和内容丰富多样的视频盛宴的同时,也在不断被大量冗余、无效的信息冲击。这些庞大的数据信息远远超出了用户能承受的程度,严重干扰了用户对自身所需信息的正确选择,导致信息利用率非常低,甚至带给用户困扰和反感。
[0003]推荐系统作为解决“信息过载”问题的有效手段,这些年来在得以迅速发展,其在互联网服务中的作用也日益增加。电影作为丰富信息的一种载体,自然成为个性化推荐中一类重要的研究对象。随着用户和电影数量的不断增长,如何深度挖掘电影信息,准确匹配用户兴趣,从茫茫电影库中为用户挑选合适的电影,提供精准的个性化服务,已经成为行业内研究的热点。
[0004]电影推荐算法是电影推荐系统的核心,目前使用比较多的是协同过滤,它是基于用户的观看历史,找到与目标用户看过同样视频的相似用户,然后找到这些相似用户喜欢看的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于改进深度结构化语义模型的电影推荐系统,其特征在于,包括用户行为采集与处理模块、离线训练模块和在线召回与排序模块,所述用户行为采集与处理模块通过在前端埋点,收集用户的互动行为日志、搜索行为日志和播放记录列表,作为用户特征数据存入文件系统特征库中,借助数据仓库工具,对收集的日志进行数据清洗得到基础样本原始数据集;根据清洗得到的原始数据,系统对用户的行为日志进行预处理,对用户的行为日志进行数据合并;所述离线训练模块接收用户行为采集与处理模块输出的合并后的数据样本,对数据编码和降维后,对数据重新赋权,并对数据进行深层隐语义特征的提取与挖掘,根据数据特征对用户和电影之间匹配;所述在线召回与排序模块根据用户的属性特征中取出用户已经训练得出的用户特征向量,并采用近似最近邻搜索技术在电影向量库中做向量检索,召回为用户推荐的电影子集。2.根据权利要求1所述的一种基于改进深度结构化语义模型的电影推荐系统,其特征在于,所述离线训练模块包括输入层、自注意力层、特征抽取层和匹配层,所述用户行为采集与处理模块输出的用户特征数据合并后发送至输入层,所述输入层包括编码模块和降维模块,所述输入层对用户特征数据输入至编码模块和降维模块;所述自注意力层采用压缩激励网络SENET对输入层的数据重新赋权;所述特征抽取层使用三个全连接网络组成深度神经网络,用于对输入的用户和电影特征向量进行深层隐语义特征的提取与挖掘;所述匹配层根据提取出的隐语义特征向量,通过计算它们之间的余弦相似度,得到用户和电影间的匹配得分。3.根据权利要求2所述的一种基于改进深度结构化语义模型的电影推荐系统,其特征在于,所述用户特征数据包括用户稠密特征和用户稀疏特征,所述用户稠密特征输入至编码模块,所述用户稀疏特征输入至降维模块;所述用户稀疏特征包括有确定值的稀疏特征和变长稀疏特征,所述有确定值的稀疏特征输入编码模块后,输出为低维向量;所述变长稀疏特征包括观看历史和搜索历史,所述观看历史对应的电影嵌入序列经降维模块向量加权平均后得到观看向量;所述搜索历史经降维模块训练得到嵌入向量,对应的电影嵌入序列经加权平均后得到搜索向量;所述搜索历史与观看历史交错对应训练,所述输入层再将处理后的稀疏特征和稠密特征拼接,并将拼接后的用户和电影向量作为初始嵌入向量。4.根据权利要求2所述的一种基于改进深度结构化语义模型的电影推荐系统,其特征在于,所述自注意力层包括压缩模块和激发模块,所述压缩模块对从输入层接收到的每个特征的嵌入向量进行数据压缩与信息汇总,形成初始权重向量;
所述激发模块用于对压缩模块输出的初始权重向量做特征交叉和保持输出大小维度;所述离线推荐模块匹配层根据特征抽取层提取出的隐语义特征向量,计算它们之间的余弦相似度,得到用户和电影间的匹配得分。5.根据权利要求1所述的一种基于改进深度结构化语义模型的电影推荐系统,其特征在于,所述在线召回与排序模块根据用户的属性特征中取出用户已经训练得出的用户特征向量,并采用近似最近邻搜索技术在电影向量库中召回为用户推荐的电影子集,在排序阶段去掉用户已经观看过的电影,将剩余电影与用户特征向量计算相似度,以此作为排序依据,并返回推荐结果列表。6.一种基于改进深度结构化语义模型的电影推荐方法,其特征在于,包括以下步骤:S1:用户行为采集和处理:通过在前端埋点,收集用户的互动行为日志、搜索行为日志和播放记录列表,存入文件系统中,借助数据仓库工具,对收集的日志进行数据清洗得到原始数据集;根据清洗得到的原始数据,系统对用户的行为日志进行预处理,对用户的行为日志进行数据合并;S2:离线训练:经S1接收用户行为采集与处理模块输出的合并后的数据,对数据编码和降维后,对数据重新赋权,并对数据进行深层隐语义特征的提取与挖掘,根据数据特征对用户和电影之间匹配;S3:在线召回与排序:根据用户的属性特征中取出用户已经训练得出的用户特征向量,并采用近似最近邻搜索技术在电影向量库中召回为用户推荐的电影子集。7.根据权利要求6所述的一种基于改进深度结构...

【专利技术属性】
技术研发人员:孙知信张坤孙哲赵学键胡冰宫婧汪胡青
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1