基于建模的节目数据推荐方法及系统技术方案

技术编号：29673901 阅读：35 留言：0更新日期：2021-08-13 21:55

本发明专利技术提供了一种基于建模的节目数据推荐方法及系统，其中的方法包括：从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据；根据训练数据对预设的NPR‑AI模型进行训练，并根据验证数据和训练好的NPR‑AI模型确定NPR‑AI模型的参数和信息的组合方式；在所述规定时间阶段后紧邻的时间周期的节目单中确定NPR‑AI模型的入模参数；基于入模参数和所述NPR‑AI模型进行用户观看节目的预测和推荐。本发明专利技术通过对节目的多源辅助信息进行分类表示，充分挖掘辅助信息、节目和用户之间的深层次关系，同时引入多层异质注意力机制，捕捉用户和节目之间更多的语义关系，从而更加准确地进行节目表示和用户表示，提高了推荐系统的性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于建模的节目数据推荐方法及系统
本专利技术涉及人工智能领域下的智能推荐领域，更为具体地，涉及一种基于建模的节目数据推荐方法及系统。
技术介绍
大数据信息时代，互联网的发展日益迅猛，网络平台上的信息量呈指数级增长，出现了“信息过载”的问题。尤其是在蓬勃发展的娱乐影视领域，电视节目数量激增，为了从海量信息中准确地选择出用户感兴趣的有价值的信息，推荐系统应运而生。目前，推荐系统已经在电子商务、新闻、电影等诸多领域发挥了重要作用，成为现代互联网应用场景中不可缺少的一部分。然而，现有的广播电视节目推荐方法主要是基于协同过滤的传统方法，它们基于用户和节目的基本交互数据进行推荐，节目属性信息数据使用率极低，对用户隐性行为挖掘不够全面，忽略了其他辅助信息的重要价值，无法满足针对不同用户进行个性化影视节目推荐需求。因此，研究构建基于多源辅助信息的神经网络推荐方法是十分有必要的。
技术实现思路
鉴于上述问题，本专利技术的目的是通过提出基于辅助信息的神经网络推荐算法，融合异质注意力机制，探究不同辅助信息组合对...

【技术保护点】
1.一种基于建模的节目数据推荐方法，包括：/n从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据；/n根据所述训练数据对预设的NPR-AI模型进行训练，并根据所述验证数据和训练好的NPR-AI模型确定所述NPR-AI模型的参数和信息的组合方式；/n在所述规定时间阶段后紧邻的时间周期的节目单中根据所述参数和信息的组合方式确定所述NPR-AI模型的入模参数；/n基于所述入模参数和所述NPR-AI模型进行用户观看节目的预测和推荐。/n

【技术特征摘要】
1.一种基于建模的节目数据推荐方法，包括：
从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据；
根据所述训练数据对预设的NPR-AI模型进行训练，并根据所述验证数据和训练好的NPR-AI模型确定所述NPR-AI模型的参数和信息的组合方式；
在所述规定时间阶段后紧邻的时间周期的节目单中根据所述参数和信息的组合方式确定所述NPR-AI模型的入模参数；
基于所述入模参数和所述NPR-AI模型进行用户观看节目的预测和推荐。

2.如权利要求1所述的基于建模的节目数据推荐方法，其中，所述NPR-AI模型的训练过程包括：
将所述训练数据中的上下文相关信息和上下文无关信息分别进行编码表示；其中，所述上下文相关信息为所述训练数据中具有上下文语义关联的信息，所述上下文无关信息为所述训练数据中没有上下文语义关联的单词；
根据所述上下文相关信息的注意力权重和上下文无关信息的注意力权重，将编码表示的所述上下文相关信息和上下文无关信息进行融合处理，以确定基于节目注意力的节目表示；
根据所述基于节目注意力的节目表示确定基于个性化注意力的用户表示；
根据所述基于个性化注意力的用户表示进行用户观看节目预测。

3.如权利要求2所述的基于建模的节目数据推荐方法，其中，将所述训练数据中的上下文相关信息进行编码表示，包括：
提取所述训练数据中的上下文相关信息；
对所提取的上下文相关信息进行分词得到个词语，词语表示为；使用嵌入层对词语进行嵌入表示，表示为；
通过使用CNN与非线性激活函数ReLU来确定所述上下文相关信息的单词序列表示为，第个单词的上下文表示为：

其中，为从到的位置的词嵌入的拼接，是过滤器的长度，和为CNN网络中的训练参数；
使用注意力机制确定一组上下文相关信息中第个词语的注意力权重表示：

其中，和是注意力模型中的训练参数，是注意力模型中的查询向量；
最终将所述上下文相关信息表示为：

。

4.如权利要求3所述的基于建模的节目数据推荐方法，其中，将所述训练数据中的上下文无关信息进行编码表示，包括：
提取所述训练数据中的上下文无关信息；
将所提取的上下文无关信息进行离散化转换为数值型，通过词嵌入层得到所述上下文无关信息的嵌入表示为，其中是上下文无关信息的个数，是第个信息的向量表示；
根据所述上下文无关信息的嵌入，确定所述上下文无关信息的综合信息表示：；
使用Dropout方法对所述综合信息表示进行防过拟合处理，以确定所述上下文无关信息表示：

其中，和是R...

【专利技术属性】
技术研发人员：殷复莲，李思彤，冀美琪，邢彤彤，姚泽斌，吴肇良，冯小丽，佘雨薇，潘妍妍，
申请(专利权)人：中国传媒大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人