基于用户画像和知识图谱的广电技术知识推荐方法技术

技术编号:35168173 阅读:11 留言:0更新日期:2022-10-12 17:31
本发明专利技术提出了一种基于用户画像和知识图谱的广电技术知识推荐方法,涉及智慧广电技术领域。一方面从多维度构建了一套广电技术知识用户画像,并结合协同过滤算法计算出用户间的相似度,从而基于相似用户的喜爱项目预测出该用户感兴趣的项目;另一方面,构建了一个基于知识图谱的推荐模型,通过“偏好扩散”自发挖掘用户的潜在偏好,并将知识图谱特征学习融入到基于循环神经网络的推荐模型中,获取更深层次的用户偏好,从而预测出该用户感兴趣的项目。最终,将通过两种方式获得的感兴趣项目按评分进行排序,并提取前若干个项目推送给用户。通过结合知识图谱和用户图像两种方式,能够有效提升广电知识智库推荐的智能化水平,使得推荐结果更加准确。结果更加准确。结果更加准确。

【技术实现步骤摘要】
基于用户画像和知识图谱的广电技术知识推荐方法


[0001]本专利技术涉及智慧广电
,具体而言,涉及一种基于用户画像和知识图谱的广电技术知识推荐方法。

技术介绍

[0002]当前,数字化改革正处在“全面贯通、集成突破、集中展示”的重要阶段,置身于数字化改革的时代浪潮,各省的市县级电视总台把数字化改革作为重要政治任务和推动改革创新的重要抓手。为了更好地推动市县级地方电视台在融媒体时代新一轮的高质量发展,提出了以数字化改革为引领,建立广电技术知识库的智能化推荐系统的目标。推荐系统能帮助用户高效筛选出感兴趣的信息,有利于电视观众方便而有效地获取自己喜欢的节目内容。推荐系统的目标是利用收集到的用户信息和目标物品信息,建立用户模型和物品模型,并按照特写的规则进行匹配,然后利用算法中包含的规则对计算结果进行过滤,从而找到用户可能感兴趣的商品,并将其推荐给用户。
[0003]但是传统的推荐方法,如协同过滤等,依赖用户历史偏好数据,且偏好数据十分稀疏,从而降低了推荐的准确度,同时新用户和新物品还将面临冷启动问题。知识图谱(KnowledgeGraph,KG)是Google在2012年提出的,是近年来新兴的一种辅助信息,其借助于图结构的特点表达不同知识节点之间的关系依赖等,可以对多源异构数据进行整合和知识提取,但是,现有的知识图谱没有结合特征信息做进一步挖掘,缺少了一些隐藏特征,而导致推荐结果不够准确。

技术实现思路

[0004]本专利技术的目的在于提供一种基于用户画像和知识图谱的广电技术知识推荐方法,通过充分对广电技术知识库进行组织和建模,利用知识图谱和用户图像的方式,提升广电知识智库推荐的智能化水平,推荐结果更加准确。
[0005]本专利技术的实施例是这样实现的:
[0006]第一方面,本申请实施例提供一种基于用户画像和知识图谱的广电技术知识推荐方法,其包括:
[0007]获取用户的基本属性信息和行为特征信息,并对信息进行量化和融合重构,形成用户特征向量;
[0008]基于用户特征向量,利用协同过滤算法计算得到用户之间的相似度结果,并根据相似度结果进行协同推荐,得到第一推荐邻近集;
[0009]获取用户的历史偏好数据,并根据历史偏好数据在预先构建的广电领域的知识图谱中进行扩散传播,得到用户的整体扩散偏好集;
[0010]将整体扩散偏好集中的用户偏好向量输入预设的RNN推荐模型中进行预测,得到第二推荐邻近集;
[0011]基于上述第一推荐邻近集和第二推荐邻近集融合得到最终的推荐集,并将推荐集
中的结果推送给用户。
[0012]基于第一方面,在本专利技术的一些实施例中,上述获取用户的基本属性信息和行为特征信息,并对信息进行量化和融合重构,形成用户特征向量的步骤包括:
[0013]利用one

hot编码方式对用户的基本属性信息进行编码,得到用户基本属性向量;
[0014]利用TF

IDF算法对用户的行为特征信息进行关键词提取,并将关键词转换成向量形式,得到用户行为向量;
[0015]基于上述用户基本属性向量和用户行为向量,形成用户特征向量。
[0016]基于第一方面,在本专利技术的一些实施例中,上述基于用户特征向量,利用协同过滤算法计算得到用户之间的相似度结果,并根据相似度结果进行协同推荐,得到第一推荐邻近集的步骤包括:
[0017]根据上述用户基本属性向量和用户行为向量,利用余弦相似度算法分别计算得到用户之间的属性相似度和行为相似度;
[0018]将属性相似度和行为相似度按照融合公式进行融合,得到用户之间的相似度结果,以匹配得到该用户对应的相似用户;
[0019]获取相似用户对应的广电内容项目表并推荐给该用户,形成第一推荐邻近集。
[0020]基于第一方面,在本专利技术的一些实施例中,上述融合公式为:
[0021][0022]其中,SIM(p,q)表示用户p和用户q之间的相似度结果,SIM
user
(p,q)表示用户之间的属性相似度,SIM
tech
(p,q)表示用户之间的行为相似度,x为权值系数,表示用户之间的相同属性数量与用户基本属性向量维度之间的比值。
[0023]基于第一方面,在本专利技术的一些实施例中,还包括:
[0024]获取广电领域知识数据,并通过信息抽取得到实体信息、关系信息和实体的属性信息,形成知识的三元组;
[0025]基于知识的三元组,利用TransE算法进行特征学习,得到实体和关系向量,形成广电领域的知识图谱。
[0026]基于第一方面,在本专利技术的一些实施例中,上述根据历史偏好数据在预先构建的广电领域的知识图谱中进行扩散传播,得到用户的整体扩散偏好集的步骤包括:
[0027]遍历用户的历史偏好,组合形成用户的历史偏好集;
[0028]以历史偏好集中的每个实体节点为起始点,通过知识图谱连接到该实体对应的关联实体,并统计形成第一层扩散偏好集;
[0029]以第一层扩散偏好集中的每个实体节点为起始点,通过知识图谱连接到该实体对应的关联实体,并统计形成第二层扩散偏好集;
[0030]将历史偏好集、第一层扩散偏好集和第二层扩散偏好集进行融合,得到用户的整体扩散偏好集。
[0031]基于第一方面,在本专利技术的一些实施例中,上述RNN推荐模型采用基于物品的注意力机制,根据用户扩散偏好集的层次关系,对输入的不同部分进行线性组合,构成用户的偏好特征表示,以预测用户的偏好项目,并通过最小化真实值和预测值间的交叉熵损失来训练模型。
[0032]基于第一方面,在本专利技术的一些实施例中,上述基于上述第一推荐邻近集和第二推荐邻近集融合得到最终的推荐集,并将推荐集中的结果推送给用户的步骤包括:
[0033]分别将上述第一推荐邻近集和第二推荐邻近集中的推荐结果按评分进行排序;
[0034]从第一推荐邻近集和第二推荐邻近集中抽取前若干个推荐结果,形成推送列表;
[0035]对推送列表中的推荐结果进行筛除、清洗后,将推荐结果推送给用户。
[0036]第二方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当上述一个或多个程序被上述处理器执行时,实现如上述第一方面中任一项上述的方法。
[0037]第三方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项上述的方法。
[0038]相对于现有技术,本专利技术的实施例至少具有如下优点或有益效果:
[0039]本申请实施例提供一种基于用户画像和知识图谱的广电技术知识推荐方法,一方面,基于用户的基本属性和动态行为特征从多维度构建了一套广电技术知识用户画像,并将用户各维度的信息进行量化和融合重构后,结合协同过滤算法计算出用户间的相似度,从而基于相似用户的喜爱项目预测出该用户感兴趣的项目,实现广电技术知识的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户画像和知识图谱的广电技术知识推荐方法,其特征在于,包括:获取用户的基本属性信息和行为特征信息,并对信息进行量化和融合重构,形成用户特征向量;基于用户特征向量,利用协同过滤算法计算得到用户之间的相似度结果,并根据相似度结果进行协同推荐,得到第一推荐邻近集;获取用户的历史偏好数据,并根据历史偏好数据在预先构建的广电领域的知识图谱中进行扩散传播,得到用户的整体扩散偏好集;将整体扩散偏好集中的用户偏好向量输入预设的RNN推荐模型中进行预测,得到第二推荐邻近集;基于所述第一推荐邻近集和第二推荐邻近集融合得到最终的推荐集,并将推荐集中的结果推送给用户。2.如权利要求1所述的一种基于用户画像和知识图谱的广电技术知识推荐方法,其特征在于,所述获取用户的基本属性信息和行为特征信息,并对信息进行量化和融合重构,形成用户特征向量的步骤包括:利用one

hot编码方式对用户的基本属性信息进行编码,得到用户基本属性向量;利用TF

IDF算法对用户的行为特征信息进行关键词提取,并将关键词转换成向量形式,得到用户行为向量;基于所述用户基本属性向量和用户行为向量,形成用户特征向量。3.如权利要求2所述的一种基于用户画像和知识图谱的广电技术知识推荐方法,其特征在于,所述基于用户特征向量,利用协同过滤算法计算得到用户之间的相似度结果,并根据相似度结果进行协同推荐,得到第一推荐邻近集的步骤包括:根据所述用户基本属性向量和用户行为向量,利用余弦相似度算法分别计算得到用户之间的属性相似度和行为相似度;将属性相似度和行为相似度按照融合公式进行融合,得到用户之间的相似度结果,以匹配得到该用户对应的相似用户;获取相似用户对应的广电内容项目表并推荐给该用户,形成第一推荐邻近集。4.如权利要求3所述的一种基于用户画像和知识图谱的广电技术知识推荐方法,其特征在于,所述融合公式为:其中,SIM(p,q)表示用户p和用户q之间的相似度结果,SIM
user
(p,q)表示用户之间的属性相似度,SIM
tech
(p,q)表示用户之间的行为相似度,x为权值系数,表示用户之间的相同属性数量与用户基...

【专利技术属性】
技术研发人员:江立宇刘飞尤浩东
申请(专利权)人:舟山广播电视总台
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1