一种基于图神经网络会话序列推荐方法及系统技术方案

技术编号:26171411 阅读:114 留言:0更新日期:2020-10-31 13:43
本发明专利技术公开了一种基于图神经网络会话序列推荐方法及系统,方法包括:从第三方新闻库爬取新闻源数据,进行清洗和深度分析,输出结构化数据;从数据库和用户属性表中提取新闻标签和用户属性,并将其向量化,经过计算得出与该用户属性最相近的新闻推荐;为用户提供个性化的标签选项,并且实时监测用户行为并反馈数据回传至模型;获取用户行为数据,对获取数据进行分析和筛选,并将筛选后的数据构建为会话序列数据;利用用户会话序列数据来训练GNN模型,预测用户下一时刻行为,实现新闻推荐。本发明专利技术还提供一种基于图神经网络会话序列推荐系统。本方案采用基于内容的推荐策略,并将协同过滤算法作为补充,更敏捷地捕捉用户的兴趣点并实时进行新闻推荐。

A session sequence recommendation method and system based on graph neural network

【技术实现步骤摘要】
一种基于图神经网络会话序列推荐方法及系统
本专利技术涉及领域,尤其涉及一种基于图神经网络会话序列推荐方法及系统。
技术介绍
21世纪是信息爆炸增长的时代,人们面对互联网上良莠不齐的信息往往束手无策,很难获取到符合自己兴趣和期望的内容。例如在新闻领域,每天有数以万计的新闻出现在我们面前,如何为用户提供及时、准确、符合用户期望的新闻内容成为当下的一个研究热题。个性化推荐算法是解决上述问题的一个利器。传统的推荐算法在新闻推荐领域的应用主要有以下三个方法:1)基于协同过滤的推荐;2)基于相似内容的推荐;3)基于新闻热点的推荐。在构建召回模型的时候,通常假定用户属性和用户历史行为是被持续记录的,即模型是基于用户属性和历史行为进行构建的。然而在某些服务或应用场景下,用户身份或属性是未知的,且用户历史行为数据的获取也是困难。现有的推荐系统对用户特征表示不够准确,忽略了item中复杂的转换特性,因此不能实现实时捕捉用户的兴趣点并进行实时新闻推荐。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于图神经网络会话序列推本文档来自技高网...

【技术保护点】
1. 一种基于图神经网络会话序列推荐方法,其特征在于,方法包括以下步骤: S1,新闻预处理,从第三方新闻库爬取新闻源数据,并进行新闻内容的清洗和深度分析,最终输出为经过预处理的结构化新闻数据;/nS2,基于标签推荐,从数据库和用户属性表中提取新闻标签和用户属性,并将其向量化,经过余弦相似度的计算得出与该用户属性最相近的新闻推荐;/nS3,用户体验反馈,为用户提供一系列个性化的标签选项,并且实时监测用户行为作为反馈数据回传至模型;/nS4,会话序列分析,获取用户行为数据,同时对获取的数据进行分析和筛选,并将筛选后的行为数据构建为会话序列数据;/nS5,会话训练推荐,利用用户会话序列数据来训练GN...

【技术特征摘要】
1.一种基于图神经网络会话序列推荐方法,其特征在于,方法包括以下步骤:S1,新闻预处理,从第三方新闻库爬取新闻源数据,并进行新闻内容的清洗和深度分析,最终输出为经过预处理的结构化新闻数据;
S2,基于标签推荐,从数据库和用户属性表中提取新闻标签和用户属性,并将其向量化,经过余弦相似度的计算得出与该用户属性最相近的新闻推荐;
S3,用户体验反馈,为用户提供一系列个性化的标签选项,并且实时监测用户行为作为反馈数据回传至模型;
S4,会话序列分析,获取用户行为数据,同时对获取的数据进行分析和筛选,并将筛选后的行为数据构建为会话序列数据;
S5,会话训练推荐,利用用户会话序列数据来训练GNN模型,达到预测用户下一时刻行为的目标,从而实现新闻推荐。


2.根据权利要求1所述的一种基于图神经网络会话序列推荐方法,其特征在于,所述步骤S1中新闻预处理过程具体包括以下子步骤:
S101,基于scrapy框架利用爬虫软件从新闻源数据库中并发爬取半结构化或纯文本的新闻源数据,并进行数据清洗和组织,生成结构化数据;
S102,采用TF-IDF算法进行关键字提取,从而为每篇新闻打上标签,并分析该新闻的热度情况,最终生成预处理后的新闻数据,存入数据库。


3.根据权利要求1所述的一种基于图神经网络会话序列推荐方法,其特征在于,所述步骤S2中基于标签推荐具体过程包括以下子步骤:
S201,从数据库中获取新闻数据,并提取出每个新闻的标签,采用词袋模型生成对应新闻的标签向量;
S202,获取用户体验反馈部分在用户属性表中生成的用户属性,并生成对应用户的属性向量;
S203,基于相似度计算模型,经过余弦相似度的计算得出与该用户属性最相近的新闻作为推荐候选集;
S204,采用新闻热度排序的方式选出热度最高的N个新闻作为最终候选集,并写入推荐候选表。


4.根据权利要求1所述的一种基于图神经网络会话序列推荐方法,其特征在于,所述步骤S3中用户体验反馈过程基体包括以下子步骤:
S301,为用户提供一系列新闻类型标签以供选择,并根据用户选择的标签向用户推荐新闻,同时将用户选择的标签作为用户属性;
S302,实时监测用户的行为,采集用户浏览新闻过程生成的个性化行为数据,并实时的存入用户的行为数据表中。


5.根据权利要求1所述的一种基于图神经网络会话序列推荐方法,其特征在于,所述步骤S4中会话序列分析过程具体包括以下子步骤:
S401,从用户行为数据表中获取行为数据,根据用户对新闻的行为程度进行行为筛选,将数据库中新闻划分为感兴趣或不感兴趣两部分;
S402,根据用户感兴趣的新闻数据构建会话序列,基于时间序列生成一系列会话,每个会话包含多个行为,然后存入会话序列数据表中,以供模型使用。


6.根据权利要...

【专利技术属性】
技术研发人员:李冬芬王惠明刘明哲钟豪王林平唐小川
申请(专利权)人:成都理工大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1