System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于少样本知识图谱的细粒度兴趣点推荐方法和装置制造方法及图纸_技高网

一种基于少样本知识图谱的细粒度兴趣点推荐方法和装置制造方法及图纸

技术编号:40517533 阅读:5 留言:0更新日期:2024-03-01 13:34
本文提出基于少样本知识图谱的兴趣点推荐方法。首先,根据用户签到数据构建知识图谱,运用嵌入向量算法学得用户、兴趣点和兴趣点类别的交互关系矩阵。处理不确定签到数据,建模兴趣点类别分布提取用户隐式交互信息。采用图卷积神经网络聚合用户全局偏好,并通过三头注意力编码器提取轨迹信息。最终,通过多层感知机解码器,结合用户个性化偏好分数,得出最终的兴趣点推荐结果。实验证明方法的有效性,尤其对不确定签到提供了新的处理思路。

【技术实现步骤摘要】

本专利技术涉及推荐系统,尤其涉及一种基于少样本知识图谱的细粒度兴趣点推荐方法和装置


技术介绍

1、近年来,移动互联网的迅速发展催生出了若干个相关领域应用,其中基于地理位置信息的社交平台,如美团,大众点评等应用的发展状况尤其为盛。用户在该类平台上发布的针对某个地理位置的评价信息为兴趣点签到信息。日益累积的兴趣点签到信息组成了大量的用户行为数据,促使平台给用户推荐其可能更感兴趣的地点。由此便为推荐系统领域开辟了一个新的子领域,即兴趣点推荐。

2、兴趣点推荐的准确率关乎用户体验,是推荐系统中至关重要的一个指标。在过去的研究中,人们主要提出了两种策略来提升这一指标,分为基于序列模型和基于图模型的方案。基于序列模型的方案将用户访问的历史兴趣点记录抽象为一个序列,将其输入马尔科夫链或者循环神经网络及其变种得到推荐结果;基于图模型的方案则在序列模型的基础上又将用户访问兴趣点的行为抽象为一个图,该图中各个结点为用户和兴趣点,结点之间的边则是用户和兴趣点之间的访问关系以及各个兴趣点被访问的顺序关系。

3、然而,现有的方法大多忽略了一个事实,即用户提供的签到数据本身可能是不精确的。兴趣点签到数据本身可能由于室内gps定位精度或者是用户本身出于隐私安全的考虑,没有提供准确的地理位置信息,如用户在某个商场中的餐厅用餐后只留下了在该商场地理位置信息的签到记录,这样的签到记录称为不确定签到。该问题一方面会导致推荐的准确性下降,另一方面会加剧冷启动问题。因此,需要针对该问题对推荐系统进一步改进,即基于该类不完整或者是粗粒度的原始数据提供细粒度且精确的推荐。


技术实现思路

1、本专利技术要克服现有技术的上述缺点,提供一种基于少样本知识图谱的细粒度兴趣点推荐方法和装置。

2、本专利技术针对现实场景的实际问题改进了现有方案,提高用户兴趣点推荐的准确性。本专利技术首先构建了一个包含用户与兴趣点以及兴趣点类别之间的全局性和局部性的交互关系和过渡关系的知识图谱,然后使用知识图谱嵌入向量算法对其中的实体和关系进行向量化处理。同时本专利技术为了解决签到数据潜在的不精确问题,对兴趣点相关数据本身进行了细粒度处理,提取出了其中的兴趣点类别的过渡和分布情况用于辅助计算。最后,本专利技术提出了一个基于知识图谱的增强转换器模型,该模型可以联合计算出用户对兴趣点的全局偏好和个人偏好,由此提高兴趣点推荐的准确性,降低用户对兴趣点的选择成本,提升用户体验。

3、为了实现上述目的,本专利技术的第一个方面涉及一种基于少样本知识图谱的细粒度兴趣点推荐方法,包括如下步骤:

4、(1)将用户的兴趣点签到记录按照时间戳排序分成轨迹序列,进而提取三元组以构建知识图谱,所述的三元组包括用户对兴趣点的访问关系以及兴趣点与兴趣点之间的过渡关系。

5、(2)利用知识图谱嵌入向量算法将知识图谱中的实体和关系映射为对应的嵌入向量,并同时生成四个邻接矩阵,分别描述了兴趣点与兴趣点类别之间的过渡关系,以及用户与兴趣点和兴趣点类别之间的交互关系。

6、(3)针对不确定签到情况,生成兴趣点中包含的兴趣点类别分布,将其作为后续细粒度推荐的辅助数据。

7、(4)通过图卷积神经网络聚合兴趣点和兴趣点类别的过渡关系,获取用户对兴趣点的全局偏好;设计用户个性化偏好模块,计算用户与兴趣点、兴趣点类别之间的交互关系,从而获得用户对兴趣点的个性化偏好分数。

8、(5)将用户轨迹映射为聚合后的嵌入向量,并将其用作转换器模型的输入进行训练;通过逐轮迭代优化模型参数,最终实现更精准的兴趣点推荐。

9、所述步骤(1)的知识图谱构建任务基于前置的轨迹划分任务;在轨迹划分任务中,首先将数据集中的签到记录按照用户编号进行分组并过滤记录数少于10条的用户,然后将签到记录按照时间戳的信息划分轨迹并过滤长度小于5的轨迹;在知识图谱构建任务中,首先提取出签到信息中的用户编号、兴趣点编号、兴趣点类别编号,然后将以上三者作为知识图谱中三元组的实体,将用户轨迹中包含的签到信息作为用户与兴趣点和兴趣点类别的交互关系,各签到信息之间作为兴趣点或者兴趣点类别之间的过渡关系;由此构建出<用户,访问,兴趣点>,<用户,访问,兴趣点类别>,<兴趣点类别,下一个,兴趣点>,<兴趣点类别,下一个,兴趣点类别>共四类三元组

10、所述步骤(2)使用的知识图谱嵌入算法将构建好的知识图谱中的实体和关系映射为对应的嵌入向量,将各三元组的拓扑关系量化;具体而言,各嵌入向量首先被初始化为正态分布中随机采样值,然后根据三元组构建等式计算头实体在关系上与尾实体的距离,计算公式如下:

11、dr(h,t)=||h+r-t||      (1)

12、其中,h,r,t分别为头实体、关系、尾实体的嵌入向量,||·||表示欧几里得范式;知识图谱中的三元组为正样本,正样本随机替换头实体或者尾实体的三元组为负样本,通过让正样本计算的距离值尽可能小,负样本的距离值尽可能大,可以计算出符合知识图谱拓扑结构的嵌入向量,计算公式如下:

13、

14、其中表示训练过程中的损失值,s表示正样本集合,s′表示负样本集合。最后再根据更新后的嵌入向量计算各个实体在不同关系上的相似度,相似度的计算公式如下:

15、similarity(h,t)=e-d(h,t)      (3)

16、其中d(h,t)即为三元组中的距离计算公式。由此可计算出兴趣点,兴趣点类别的过渡邻接矩阵,用户与兴趣点和兴趣点类别的交互邻接矩阵。

17、所述步骤(3)中针对不确定签到的处理是基于相应兴趣点的地理拓扑信息生成兴趣点中包含的兴趣点类别分布;具体而言,不确定签到信息中的兴趣点是一个综合兴趣点,将该类兴趣点的类别表示为内部的兴趣点分布有助于推荐模型通过用户对兴趣点类别的全局偏好提升预测精度,兴趣点类别分布的计算公式如下:

18、

19、其中ci表示兴趣点类别的嵌入向量,ρi表示兴趣点类别的权重。表示聚合后兴趣点类别嵌入向量,各不确定签到的兴趣点类别的嵌入向量均采用该方式表示。

20、所述步骤(4)分别使用图卷积神经网络和偏好打分函数得到用户对兴趣点和兴趣点类别的全局偏好和个性化偏好;具体而言,对于图卷积神经网络中,此处首先对所述步骤(2)中得到的两个过渡邻接矩阵进行拉普拉斯归一化,计算公式如下:

21、

22、其中,ap指兴趣点过渡邻接矩阵,ac指兴趣点类别过渡邻接矩阵,ip和ic为单位矩阵,dp和dc则为对应的入度矩阵;两个拉普拉斯矩阵和知识图谱中训练更新后的兴趣点嵌入向量xp以及兴趣点类别嵌入向量xc会被共同作为图卷积神经网络的输入进行信息传播,计算公式如下:

23、

24、其中,l表示图卷积神经网络的层数,hp(l-1)和hc(l-1)分别为网络上一层的兴趣点和兴趣点类别的隐状态,初始隐状态hp(0)和hc(0本文档来自技高网...

【技术保护点】

1.一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于:步骤(1)所述的知识图谱构建任务基于前置的轨迹划分任务;在轨迹划分任务中,首先将数据集中的签到记录按照用户编号进行分组并过滤记录数少于10条的用户,然后将签到记录按照时间戳的信息划分轨迹并过滤长度小于5的轨迹;在知识图谱构建任务中,首先提取出签到信息中的用户编号、兴趣点编号、兴趣点类别编号,然后将以上三者作为知识图谱中三元组的实体,将用户轨迹中包含的签到信息作为用户与兴趣点和兴趣点类别的交互关系,各签到信息之间作为兴趣点或者兴趣点类别之间的过渡关系;由此构建出<用户,访问,兴趣点>,<用户,访问,兴趣点类别>,<兴趣点类别,下一个,兴趣点>,<兴趣点类别,下一个,兴趣点类别>共四类三元组。

3.根据权利要求1所述的一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于:步骤(2)所述的通过知识图谱嵌入算法将构建好的知识图谱中的实体和关系映射为对应的嵌入向量,将各三元组的拓扑关系量化;具体而言,各嵌入向量首先被初始化为正态分布中随机采样值,然后根据三元组构建等式计算头实体在关系上与尾实体的距离,计算公式如下:

4.根据权利要求1所述的一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于:步骤(3)所述为针对不确定签到情况,生成兴趣点中包含的兴趣点类别分布;具体而言,不确定签到信息中的兴趣点是一个综合兴趣点,将该类兴趣点的类别表示为内部的兴趣点分布有助于推荐模型通过用户对兴趣点类别的全局偏好提升预测精度,兴趣点类别分布的计算公式如下:

5.根据权利要求1所述的一种基于知识图谱驱动的兴趣点推荐方法,其特征在于:步骤(4)中分别使用图卷积神经网络和偏好打分函数得到用户对兴趣点和兴趣点类别的全局偏好和个性化偏好;具体而言,对于图卷积神经网络中,此处首先对所述步骤(2)中得到的两个过渡邻接矩阵进行拉普拉斯归一化,计算公式如下:

6.根据权利要求1所述的一种基于知识图谱驱动的兴趣点推荐方法,其特征在于:步骤(5)中将用户轨迹映射成聚合后的嵌入向量是将签到记录中的用户编号、兴趣点编号、兴趣点类别编号、签到时间戳的信息映射成相应的嵌入向量后进行拼接聚合,计算公式如下:

7.根据权利要求6所述的一种基于知识图谱驱动的兴趣点推荐方法,其特征在于:转换器模型经过多轮学习后最终的优化参数为:知识图谱中各嵌入向量维度的大小为256,时间戳嵌入向量维度的大小为32,图卷积神经网络共有3层,各层的维度为[32,64,128];训练时采取的优化器为自适应矩估计优化器,学习率为0.001,权重衰减值为0.0005,每轮训练的批次大小为32,训练轮数为200。

8.一种基于知识图谱驱动的兴趣点推荐装置,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现权利要求1-7中任一项所述的一种基于知识图谱驱动的兴趣点推荐方法。

9.一种计算机可读存储介质,其特征在于,其上存储有程序,该程序被处理器执行时,实现权利要求1-7中任一项所述的一种基于知识图谱驱动的兴趣点推荐方法。

...

【技术特征摘要】

1.一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于:步骤(1)所述的知识图谱构建任务基于前置的轨迹划分任务;在轨迹划分任务中,首先将数据集中的签到记录按照用户编号进行分组并过滤记录数少于10条的用户,然后将签到记录按照时间戳的信息划分轨迹并过滤长度小于5的轨迹;在知识图谱构建任务中,首先提取出签到信息中的用户编号、兴趣点编号、兴趣点类别编号,然后将以上三者作为知识图谱中三元组的实体,将用户轨迹中包含的签到信息作为用户与兴趣点和兴趣点类别的交互关系,各签到信息之间作为兴趣点或者兴趣点类别之间的过渡关系;由此构建出<用户,访问,兴趣点>,<用户,访问,兴趣点类别>,<兴趣点类别,下一个,兴趣点>,<兴趣点类别,下一个,兴趣点类别>共四类三元组。

3.根据权利要求1所述的一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于:步骤(2)所述的通过知识图谱嵌入算法将构建好的知识图谱中的实体和关系映射为对应的嵌入向量,将各三元组的拓扑关系量化;具体而言,各嵌入向量首先被初始化为正态分布中随机采样值,然后根据三元组构建等式计算头实体在关系上与尾实体的距离,计算公式如下:

4.根据权利要求1所述的一种基于少样本知识图谱的细粒度兴趣点推荐方法,其特征在于:步骤(3)所述为针对不确定签到情况,生成兴趣点中包含的兴趣点类别分布;具体而言,不确定签到信息中的兴趣点是一个综合兴趣点,将该类兴趣点的类别表示为内部的兴趣点分布有助于推荐模型...

【专利技术属性】
技术研发人员:沈国江陈之瑜毕俊辉孔祥杰杜嘉欣
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1