一种融合实体知识的农业人机混合推荐方法及系统技术方案

技术编号:37713308 阅读:7 留言:0更新日期:2023-06-02 00:07
本发明专利技术公开了一种融合实体知识的农业人机混合推荐方法及系统,属于推荐系统及方法技术领域,其方法包括协同过滤、基于内容的推荐、冷启动推荐、知识图谱嵌入和词向量嵌入,其系统包括数据输入模块,数据输入模块连接有特征构造模块,特征构造模块连接有推荐召回模块,推荐召回模块连接有排序模块。本发明专利技术通过采用并行的混合范式构建人机混合推荐系统,基于用户的静态属性数据和动态行为数据,并行使用协同过滤和基于内容的推荐,同时引入外部农业知识图谱信息,能够解决冷启动和数据稀疏的问题,从而实现精准推荐。从而实现精准推荐。从而实现精准推荐。

【技术实现步骤摘要】
一种融合实体知识的农业人机混合推荐方法及系统


[0001]本专利技术涉及一种推荐方法及系统,特别是涉及一种融合实体知识的农业人机混合推荐方法及系统,属于推荐系统及方法


技术介绍

[0002]推荐系统作为当今互联网广泛应用的服务系统,其目的是推荐用户最感兴趣的物品,从而给用户带来更好的使用体验,经典的协同过滤算法(Collaborative Filtering,CF)基于用户行为构建用户或者物品的相似度矩阵,将相似物品推荐给同一用户或者相似的用户推荐相同的物品,这种方法能够很好地借助大数据弥补单个用户信息不足的问题,但是缺点也存在,它不适用于没有任何历史行为数据的新用户,这就是推荐系统中涉及的冷启动问题,同时,当物品数量过多时会因为数据稀疏造成相似度矩阵计算困难,另外一种推荐方法是基于内容进行推荐(Content

based),通过机器学习建模学习用户偏好和物品特征之间的关系,实现在新物品缺失相关用户行为数据的情况下,利用已知物品特征预测用户是否喜欢,但是这种推荐方法的的缺点在于需要复杂的特征工程以保证推荐的精确度,而且多样性的缺乏使得用户潜在兴趣的挖掘变得困难。
[0003]近年来,基于知识图谱和图神经网络的推荐系统逐渐兴起,知识图谱(Knowledge Graph)作为结构化的知识表示,不仅能够补充对物品语义认知的不足,还能够学习到物品之间的相关关系,但是目前现存的知识图谱都是不完整的,尤其是针对农业这类专业细分领域时,单纯依赖知识图谱进行物品推荐存在局限性,当用户行为变得复杂、数据输入量增加时,图神经网络(Graph Neural Network)能够对用户物品之间的关系进行建模,但是要得到能够实现良好推荐的图神经网络,往往需要针对特定情境精心设计网络组成、网络更新方式以及目标函数,获取大量数据作为支撑较为费时,在应用场景中的推广性较差,因此现今国内农业信息化水平有待提升,数据不足导致农业推荐系统中冷启动问题严重,同时,农业领域具有较高的专业性,且农业推荐中物品之间经常存在强关联(例如小麦选种和小麦虫害),在现有的推荐系统中往往需要大量专家参与以确保推荐效率和精度,针对以上问题,本专利技术提出一种融合实体知识的农业人机混合推荐方法及系统,采用协同过滤和基于内容的混合推荐策略,将农业领域下的先验外部知识引入推荐系统,构建一个融合实体知识的农业人机混合推荐系统,实现了协同过滤和基于内容推荐算法的短板互补,保证推荐的多样性和完整性,能够避免推荐冷启动问题并提升推荐效率和精度,降低了计算成本,改善了推荐效果,进一步提升高度专业化农业背景下推荐内容的准确性。

技术实现思路

[0004]本专利技术的主要目的是为了解决现今国内农业信息化水平有待提升,数据不足导致农业推荐系统中冷启动问题严重,同时,农业领域具有较高的专业性,且农业推荐中物品之间经常存在强关联(例如小麦选种和小麦虫害),在现有的推荐系统中往往需要大量专家参与以确保推荐效率和精度,计算成本较高的问题,而提供的一种融合实体知识的农业人机
混合推荐方法及系统。
[0005]本专利技术的目的可以通过采用如下技术方案达到:
[0006]一种融合实体知识的农业人机混合推荐方法及系统,包括如下步骤:
[0007]步骤S1,数据输入:输入使用用户的静态数据和动态数据;
[0008]步骤S2,特征构造:结合农业知识图谱,使用标签特征对用户和推荐物品进行表示,一个标签代表一个词,用于描述用户感兴趣的内容以及推荐物品相关的内容,通过标签对系统中的实体进行向量化,预测用户对推荐物品是否感兴趣,计算物品之间的相似度;
[0009]步骤S3,对召回物品排序:离线训练LR模型,根据所有用户的历史数据行为划分训练测试数据集,将用户特征和物品特征作为共同输入,训练直至能够保证模型在测试集上的准确性,将得到S3输出的召回结果的物品特征表和用户特征输入LR模型,使用LR模型预测用户对物品的偏好程度,对预测得分进行排序,得到有序的推荐物品列表;
[0010]步骤S4,推荐:结合农业知识图谱中的实体知识,将有序的推荐物品列表推送给用户,其中,普通用户采用协同推荐和内容推荐并行的方式进行推荐,新用户采用冷启动推荐的方式推荐。
[0011]作为本专利技术进一步的方法,所述S4中推荐的方法如下:
[0012](1)协同过滤推荐:使用ALS模型将用户的历史行为输入,计算得到用户对所有物品的偏好得分,定义原始矩阵是行数为m列数为n的矩阵A
m,n
,定义新矩阵是行数为k列数为n的矩阵V
k,n
,定义随机矩阵是行数为m列数为k的矩阵U
m,k
,使得A
m,n
=U
m,k
*V
k,n
,U
m,k
随机取值,固定U
m,k
后利用最小二乘法求出新矩阵V
k,n
,持续交替直到损失达到阈值,新矩阵近似于原始矩阵A
m,n
,通过ALS模型计算出的新矩阵V
k,n
拥有原始矩阵A
m,n
缺失的值,获得用于对于未访问过物品的偏好得分,过滤掉历史召回结果,防止重复推荐;
[0013](2)基于内容推荐:基于用户的历史行为得到用户偏好物品列表,根据S2得到的物品相似度矩阵,获取与发生行为的每件物品相似度最高的k个物品作为内容推荐的召回结果;
[0014](3)冷启动推荐:当用户刚刚注册,还未产生任何行为数据时,通过计算S2得到的用户标签和物品标签的相似度,获得相似度最高的k个物品作为召回结果返回。
[0015]作为本专利技术进一步的方法,所述用户特征构造的构造方法如下:所述S2中特征构造包括用户特征构造、文章特征构造和专家特征。
[0016]作为本专利技术进一步的方法,所述用户特征构造的构造方法如下:
[0017]用户特征除标签特征以外还包括基本属性特征,基本属性特征包括年龄数据、性别数据和地域数据,其中年龄数据和性别数据通过用户注册信息获取,地域数据由用户网络介入信息获取,将这些数据称为元数据,直接由标量表示,元数据的数量为m,将用户基本特征集合记为集合R
m
,将用户基本属性特征记为b
u
,则b
u
∈R
m
,对于用户的标签特征,当用户开始产生行为数据,将行为相关物品的标签按照时间衰减权重加入标签列表,然后将带权重的标签表进行嵌入,得到用户的标签特征,将用户的标签特征记为t
u
,将用户标签特征集合记为R
d
,利用基本属性特征和标签特征拼接组成用户特征,将用户特征记为v
u
,则满足v
u
∈R
m+d

[0018]作为本专利技术进一步的方法,所述文章特征构造的构造方法如下:
[0019]计算文章中所有词的TF

IDF值,得到文章的加权标签本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合实体知识的农业人机混合推荐方法,其特征在于,包括如下步骤:步骤S1,数据输入:输入使用用户的静态数据和动态数据;步骤S2,特征构造:结合农业知识图谱,使用标签特征对用户和推荐物品进行表示,一个标签代表一个词,用于描述用户感兴趣的内容以及推荐物品相关的内容,通过标签对系统中的实体进行向量化,预测用户对推荐物品是否感兴趣,计算物品之间的相似度;步骤S3,对召回物品排序:离线训练LR模型,根据所有用户的历史数据行为划分训练测试数据集,将用户特征和物品特征作为共同输入,训练直至能够保证模型在测试集上的准确性,将得到S3输出的召回结果的物品特征表和用户特征输入LR模型,使用LR模型预测用户对物品的偏好程度,对预测得分进行排序,得到有序的推荐物品列表;步骤S4,推荐:结合农业知识图谱中的实体知识,将有序的推荐物品列表推送给用户,其中,普通用户采用协同推荐和内容推荐并行的方式进行推荐,新用户采用冷启动推荐的方式推荐。2.如权利要求1所述的一种融合实体知识的农业人机混合推荐方法,其特征在于,所述S4中推荐的方法如下:(1)协同过滤推荐:使用ALS模型将用户的历史行为输入,计算得到用户对所有物品的偏好得分,定义原始矩阵是行数为m列数为n的矩阵A
m,n
,定义新矩阵是行数为k列数为n的矩阵V
k,n
,定义随机矩阵是行数为m列数为k的矩阵U
m,k
,使得A
m,n
=U
m,k
*V
k,n
,U
m,k
随机取值,固定U
m,k
后利用最小二乘法求出新矩阵V
k,n
,持续交替直到损失达到阈值,新矩阵近似于原始矩阵A
m,n
,通过ALS模型计算出的新矩阵V
k,n
拥有原始矩阵A
m,n
缺失的值,获得用于对于未访问过物品的偏好得分,过滤掉历史召回结果,防止重复推荐;(2)基于内容推荐:基于用户的历史行为得到用户偏好物品列表,根据S2得到的物品相似度矩阵,获取与发生行为的每件物品相似度最高的k个物品作为内容推荐的召回结果;(3)冷启动推荐:当用户刚刚注册,还未产生任何行为数据时,通过计算S2得到的用户标签和物品标签的相似度,获得相似度最高的k个物品作为召回结果返回。3.如权利要求1所述的一种融合实体知识的农业人机混合推荐方法,其特征在于,所述用户特征构造的构造方法如下:所述S2中特征构造包括用户特征构造、文章特征构造和专家特征。4.如权利要求3所述的一种融合实体知识的农业人机混合推荐方法,其特征在于,所述用户特征构造的构造方法如下:用户特征除标签特征以外还包括基本属性特征,基本属性特征包括年龄数据、性别数据和地域数据,其中年龄数据和性别数据通过用户注册信息获取,地域数据由用户网络介入信息获取,将这些数据称为元数据,直接由标量表示,元数据的数量为m,将用户基本特征集合记为集合R
m
,将用户基本属性特征记为b
u
,则b
u
∈R
m
,对于用户的标签特征,当用户开始产生行为数据,将行为相关物品的标签按照时间衰减权重加入标签列表,然后将带权重的标签表进行嵌入,得到用户的标签特征,将用户的标签特征记为t
u
,将用户标签特征集合记为R
d
,利用基本属性特征和标签特征...

【专利技术属性】
技术研发人员:王宁境童逸琦庄福振王德庆刘瑞
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1