基于建模的节目数据推荐方法及系统技术方案

技术编号:29673901 阅读:26 留言:0更新日期:2021-08-13 21:55
本发明专利技术提供了一种基于建模的节目数据推荐方法及系统,其中的方法包括:从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据;根据训练数据对预设的NPR‑AI模型进行训练,并根据验证数据和训练好的NPR‑AI模型确定NPR‑AI模型的参数和信息的组合方式;在所述规定时间阶段后紧邻的时间周期的节目单中确定NPR‑AI模型的入模参数;基于入模参数和所述NPR‑AI模型进行用户观看节目的预测和推荐。本发明专利技术通过对节目的多源辅助信息进行分类表示,充分挖掘辅助信息、节目和用户之间的深层次关系,同时引入多层异质注意力机制,捕捉用户和节目之间更多的语义关系,从而更加准确地进行节目表示和用户表示,提高了推荐系统的性能。

【技术实现步骤摘要】
基于建模的节目数据推荐方法及系统
本专利技术涉及人工智能领域下的智能推荐领域,更为具体地,涉及一种基于建模的节目数据推荐方法及系统。
技术介绍
大数据信息时代,互联网的发展日益迅猛,网络平台上的信息量呈指数级增长,出现了“信息过载”的问题。尤其是在蓬勃发展的娱乐影视领域,电视节目数量激增,为了从海量信息中准确地选择出用户感兴趣的有价值的信息,推荐系统应运而生。目前,推荐系统已经在电子商务、新闻、电影等诸多领域发挥了重要作用,成为现代互联网应用场景中不可缺少的一部分。然而,现有的广播电视节目推荐方法主要是基于协同过滤的传统方法,它们基于用户和节目的基本交互数据进行推荐,节目属性信息数据使用率极低,对用户隐性行为挖掘不够全面,忽略了其他辅助信息的重要价值,无法满足针对不同用户进行个性化影视节目推荐需求。因此,研究构建基于多源辅助信息的神经网络推荐方法是十分有必要的。
技术实现思路
鉴于上述问题,本专利技术的目的是通过提出基于辅助信息的神经网络推荐算法,融合异质注意力机制,探究不同辅助信息组合对推荐系统性能的影响,实现个性化推荐模型的构建,将其应用于广播电视节目推荐中,并提高推荐系统的准确性和排序性指标值。根据本专利技术的一个方面,提供了一种基于建模的节目数据推荐方法,包括:从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据;根据所述训练数据对预设的NPR-AI模型进行训练,并根据所述验证数据和训练好的NPR-AI模型确定所述NPR-AI模型的参数和信息的组合方式;在所述规定时间阶段后紧邻的时间周期的节目单中根据所述参数和信息的组合方式确定所述NPR-AI模型的入模参数;基于所述入模参数和所述NPR-AI模型进行用户观看节目的预测和推荐。根据本专利技术的另一方面,提供了一种基于建模的节目数据推荐系统,包括:数据提取单元,用于从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据;模型训练单元,用于根据所述训练数据对预设的NPR-AI模型进行训练;模型验证单元,用于根据所述验证数据和训练好的NPR-AI模型确定所述NPR-AI模型的参数和信息的组合方式;入参确定单元,用于在所述规定时间阶段后紧邻的时间周期的节目单中根据所述参数和信息的组合方式确定所述NPR-AI模型的入模参数;预测推荐单元,用于基于所述入模参数和所述NPR-AI模型进行用户观看节目的预测和推荐。上述根据本专利技术的基于建模的节目数据推荐方法及系统,针对目前广播电视领域的推荐系统中节目属性信息数据使用率极低,对用户隐性行为挖掘不够全面,无法满足针对不同用户进行个性化影视节目推荐需求的问题,提供了一种基于多源辅助信息的异质注意力神经网络推荐方法(NPR-AI),通过对节目的多源辅助信息进行分类表示,充分挖掘辅助信息、节目和用户之间的深层次关系,同时引入多层异质注意力机制,捕捉用户和节目之间更多的语义关系,从而更加准确地进行节目表示和用户表示,提高了推荐系统的性能。为了实现上述以及相关目的,本专利技术的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本专利技术的某些示例性方面。然而,这些方面指示的仅仅是可使用本专利技术的原理的各种方式中的一些方式。此外,本专利技术旨在包括所有这些方面以及它们的等同物。附图说明通过参考以下结合附图的说明及权利要求书的内容,并且随着对本专利技术的更全面理解,本专利技术的其它目的及结果将更加明白及易于理解。在附图中:图1为根据本专利技术实施例的基于建模的节目数据推荐方法的流程图;图2为根据本专利技术实施例的NPR-AI模型的训练过程示意图;图3为根据本专利技术实施例的基于建模的节目数据推荐系统的方框示意图。在所有附图中相同的标号指示相似或相应的特征或功能。具体实施方式在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。在其它例子中,为了便于描述一个或多个实施例,公知的结构和设备以方框图的形式示出。随着注意力机制在神经网络领域的发展,注意力机制与推荐系统的融合也受到广泛关注。故本专利技术提出一种基于多源辅助信息的异质注意力神经推荐方案,基于建模进行节目数据的预测和推荐,探究不同辅助信息组合对模型有效性的影响。本专利技术通过将辅助信息分为上下文相关和上下文无关信息两类,针对不同的特性分别进行编码表示,然后基于节目注意力机制对上下文相关信息编码和上下文无关信息编码进行融合以获得节目表示。在此基础上,基于个性化注意力机制整合用户观看过的节目表示以获得用户表示,最终实现对用户观看节目的合理预测。以下将结合附图对本专利技术的具体实施例进行详细描述。图1示出了根据本专利技术的基于建模的节目数据推荐方法的流程图。如图1所示,本专利技术提供的基于建模的节目数据推荐方法,包括如下步骤:S110:从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据;S120:根据所述训练数据对预设的NPR-AI模型进行训练,并根据所述验证数据和训练好的NPR-AI模型确定所述NPR-AI模型的参数和信息的组合方式;S130:在所述规定时间阶段后紧邻的时间周期的节目单中根据所述参数和信息的组合方式确定所述NPR-AI模型的入模参数;S140:基于所述入模参数和所述NPR-AI模型进行用户观看节目的预测和推荐。整体而言,本专利技术提供的基于建模的节目数据推荐方法包括三个数据处理阶段:数据库的构建以及参数设置、模型训练、模型应用。以下将结合上述步骤对这三个数据处理阶段做示例性说明。数据库的构建以及参数设置为了训练模型,首先需要获取模型的训练数据,本专利技术首先从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据。具体的,作为示例,本专利技术使用北京某月的广播电视节目用户观看数据作为预设用户节目观看数据。在该月的观看数据中选择90%作为模型的训练数据,剩下的10%作为验证数据,在验证数据上进行不同辅助信息组合的探究实验,选择该月的下一周数据作为测试数据。其中,验证数据主要是在训练模型之后根据验证数据所在时间段的节目单进行用户节目预测验证,以确定模型的参数信息的组合方式;测试数据用来测试模型的有效性。对于用户选择观看的节目来说,节目名称是他们能够获得的第一条有效且代表性信息,节目标签可以用来判断该节目是否符合他们的喜好,而频道信息则反映了用户的节目观看行为,因此节目名称、标签和频道信息对于节目表示的构建非常重要。对于任意一个节目来说,节目信息不只是包括节目名称,还包括节目标签、频道、简介、导演、演员等其他辅助信息。这些辅助信息可以根据是否上下文是否相关而分为两类,即上下文相关信息和上下文无关信息。在节目辅助信息中,节目标签、频道、导演本文档来自技高网...

【技术保护点】
1.一种基于建模的节目数据推荐方法,包括:/n从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据;/n根据所述训练数据对预设的NPR-AI模型进行训练,并根据所述验证数据和训练好的NPR-AI模型确定所述NPR-AI模型的参数和信息的组合方式;/n在所述规定时间阶段后紧邻的时间周期的节目单中根据所述参数和信息的组合方式确定所述NPR-AI模型的入模参数;/n基于所述入模参数和所述NPR-AI模型进行用户观看节目的预测和推荐。/n

【技术特征摘要】
1.一种基于建模的节目数据推荐方法,包括:
从预设用户节目观看数据库中提取规定时间阶段的用户观看数据作为训练数据和验证数据;
根据所述训练数据对预设的NPR-AI模型进行训练,并根据所述验证数据和训练好的NPR-AI模型确定所述NPR-AI模型的参数和信息的组合方式;
在所述规定时间阶段后紧邻的时间周期的节目单中根据所述参数和信息的组合方式确定所述NPR-AI模型的入模参数;
基于所述入模参数和所述NPR-AI模型进行用户观看节目的预测和推荐。


2.如权利要求1所述的基于建模的节目数据推荐方法,其中,所述NPR-AI模型的训练过程包括:
将所述训练数据中的上下文相关信息和上下文无关信息分别进行编码表示;其中,所述上下文相关信息为所述训练数据中具有上下文语义关联的信息,所述上下文无关信息为所述训练数据中没有上下文语义关联的单词;
根据所述上下文相关信息的注意力权重和上下文无关信息的注意力权重,将编码表示的所述上下文相关信息和上下文无关信息进行融合处理,以确定基于节目注意力的节目表示;
根据所述基于节目注意力的节目表示确定基于个性化注意力的用户表示;
根据所述基于个性化注意力的用户表示进行用户观看节目预测。


3.如权利要求2所述的基于建模的节目数据推荐方法,其中,将所述训练数据中的上下文相关信息进行编码表示,包括:
提取所述训练数据中的上下文相关信息;
对所提取的上下文相关信息进行分词得到个词语,词语表示为;使用嵌入层对词语进行嵌入表示,表示为;
通过使用CNN与非线性激活函数ReLU来确定所述上下文相关信息的单词序列表示为,第个单词的上下文表示为:



其中,为从到的位置的词嵌入的拼接,是过滤器的长度,和为CNN网络中的训练参数;
使用注意力机制确定一组上下文相关信息中第个词语的注意力权重表示:






其中,和是注意力模型中的训练参数,是注意力模型中的查询向量;
最终将所述上下文相关信息表示为:




4.如权利要求3所述的基于建模的节目数据推荐方法,其中,将所述训练数据中的上下文无关信息进行编码表示,包括:
提取所述训练数据中的上下文无关信息;
将所提取的上下文无关信息进行离散化转换为数值型,通过词嵌入层得到所述上下文无关信息的嵌入表示为,其中是上下文无关信息的个数,是第个信息的向量表示;
根据所述上下文无关信息的嵌入,确定所述上下文无关信息的综合信息表示:;
使用Dropout方法对所述综合信息表示进行防过拟合处理,以确定所述上下文无关信息表示:



其中,和是R...

【专利技术属性】
技术研发人员:殷复莲李思彤冀美琪邢彤彤姚泽斌吴肇良冯小丽佘雨薇潘妍妍
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1