System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及智能推荐,特别是涉及一种基于时序知识图谱的信息推荐方法和装置。
技术介绍
1、知识图谱中存在大量实体能够包含用户潜在感兴趣的项目,其能够作为外部的知识源来为推荐系统提供相应建议;同时,知识图谱能够通过实体之间的关系,提高用户对推荐的项目更加感兴趣的概率。
2、现有技术中,基于时序的信息推荐为一个单一路径的时序化任务,仅从用户的某次点击信息中挖掘有效信息;通常在该类信息推荐系统中,结合知识图谱等生成用户的偏好向量表示,然后通过该偏好向量表示对候选信息进行打分,从而给出推荐的候选信息序列。但该推荐的候选信息序列无法考虑到用户的历史交互信息对于本次推荐的影响,即存在冷启动的问题,过度依赖于本次点击信息的上下文,导致无法给出基于用户喜好的信息标题推荐。
3、鉴于此,克服该现有技术所存在的缺陷是本
亟待解决的问题。
技术实现思路
1、本专利技术要解决的技术问题是提供一种基于时序知识图谱的信息推荐方法和装置,解决现有技术存在冷启动、过度依赖上下文、和无法考虑用户历史交互,导致无法给出基于用户喜好的信息标题推荐的问题。
2、本专利技术采用如下技术方案:
3、第一方面,本专利技术提供了一种基于时序知识图谱的信息推荐方法,包括:
4、根据历史点击信息中的训练信息标题,以及所述训练信息标题对应的训练候选标题,得到训练样本;根据多个训练样本构建训练样本集;
5、根据单词层、时序知识图谱层和基于多头注意力的评分层,
6、使用所述训练样本集训练所述初始信息推荐模型,得到所述训练样本集中训练样本的预估概率;根据所述训练候选标题和所述预估概率,得到损失函数值,根据所述损失函数值优化所述初始信息推荐模型的网络参数;对以上过程迭代,直至损失函数值小于预设收敛阈值或迭代次数达到预设迭代次数,得到目标信息推荐模型;
7、将候选信息标题输入所述目标信息推荐模型,得到用户点击所述候选信息标题的兴趣概率,根据所述兴趣概率,确定推荐给用户的实际信息标题。
8、进一步地,所述使用所述训练样本集训练所述初始信息推荐模型,得到所述训练样本集中训练样本的预估概率包括:
9、将所述训练样本输入所述初始信息推荐模型的单词层,所述单词层对所述训练样本进行单词层面的信息建模,得到训练标题表示向量;
10、将所述训练标题表示向量输入所述初始信息推荐模型的时序知识图谱层,所述时序知识图谱层将所述训练标题表示向量构建为离散时序知识图谱,对所述离散时序知识图谱进行邻域聚合,得到聚合后的时序知识图谱的聚合嵌入向量;
11、将多个聚合嵌入向量输入所述初始信息推荐模型的评分层,所述评分层将多个聚合嵌入向量拼接,基于注意力机制根据拼接后的多个聚合嵌入向量得到预估概率。
12、进一步地,所述时序知识图谱层将所述训练标题表示向量构建为离散时序知识图谱包括:
13、将历史点击信息所涉及的时间段划分为预设个数的时间片;
14、根据第1个时间片内的所有训练标题表示向量,构建所述第1个时间片的初始知识图谱;根据所有训练标题表示向量,扩大所述第1个时间片的初始知识图谱,得到所述第1个时间片的时序知识图谱;根据外部知识库,创建所述时序知识图谱中实体之间的实体链接,得到所述第1个时间片的离散时序知识图谱;
15、构建第2个时间片的初始知识图谱;将所述第1个时间片的离散时序知识图谱中的所有实体,加入至所述第2个时间片的初始知识图谱,得到所述第2个时间片的中间知识图谱;扩大所述第2个时间片的中间知识图谱;根据外部知识库,创建所述中间知识图谱中实体之间的实体链接,得到所述第2个时间片的离散时序知识图谱;对该过程迭代,每次将第i个时间片的离散时序知识图谱中的实体加入至第i+1个时间片的初始知识图谱,直至处理完最后一个时间片,将最后一个时间片的离散时序知识图谱,作为最终的离散时序知识图谱;其中,i≥2。
16、进一步地,所述根据所有训练标题表示向量,扩大所述第1个时间片的初始知识图谱,得到所述第1个时间片的时序知识图谱包括:
17、将初始知识图谱中的训练标题表示向量作为初始实体;其中,一个训练标题表示向量为一个初始实体;
18、根据初始实体,从外部知识库中确定待添加的实体;
19、将所有待添加的实体,分别加入至所述初始实体的预设邻居跳数的邻域内,得到所述第1个时间片的时序知识图谱,以增加邻域内的实体的数量。
20、进一步地,所述对所述离散时序知识图谱进行邻域聚合,得到聚合后的时序知识图谱的聚合嵌入向量包括:
21、根据预设偏差策略,确定所述离散时序知识图谱中需要进行聚合的训练标题表示向量;
22、使用均值聚合器公式将所述训练标题表示向量v,及所述训练标题表示向量的邻域表示向量进行聚合,得到所述聚合嵌入向量;其中,s(v)表示训练标题表示向量v的感受野,σ表示预设激活函数,w表示变换权重,b表示偏差。
23、进一步地,所述将多个聚合嵌入向量输入所述初始信息推荐模型的评分层,所述评分层将多个聚合嵌入向量拼接,基于注意力机制根据拼接后的多个聚合嵌入向量得到预估概率包括:
24、将训练样本中多个训练信息标题的聚合嵌入向量,与多个训练信息标题对应的预测候选标题的聚合嵌入向量拼接,得到拼接后的多个聚合嵌入向量;
25、使用深度注意力网络,对所述拼接后的多个聚合嵌入向量分别分配影响权重,根据所述影响权重,得到基于训练信息标题的预测候选标题的预估概率。
26、进一步地,所述将所述训练样本输入所述初始信息推荐模型的单词层,所述单词层对所述训练样本进行单词层面的信息建模,得到训练标题表示向量包括:
27、将所述训练样本从词序列转换为词嵌入向量,将所述词嵌入向量转换为语义向量序列;
28、学习所述语义向量序列的局部上下文信息,得到所述语义向量序列的上下文表示向量;
29、确定第i个上下文表示向量的注意力权重ai=tanh(v×ci+vb);基于注意力权重对多个上下文表示向量进行加权求和,得到信息标题表示其中ci表示加权后的上下文表示向量,vb表示可训练参数。
30、进一步地,所述根据所述训练候选标题和所述预估概率,得到损失函数值包括:
31、根据训练样本中的训练候选标题,以及根据所述训练样本中的多个训练信息标题的预估概率p∈[0,1],使用最小化负对数似然函数计算得到损失函数值;
32、其中,δ+表示正样本;δ-表示负样本,y表示训练样本的样本标签。
33、进一步地,所述根据历史点击信息中的训练信息标题,以及所述训练信息标题对应的训练候选标题,得到训练样本;根据多个训练样本构建训练样本集包括:
34、根据t时刻已观察到的历史点击信息中的多个训练信息标题,以及t时刻的训练候选标题,构建所述训练样本中本文档来自技高网...
【技术保护点】
1.一种基于时序知识图谱的信息推荐方法,其特征在于,包括:
2.根据权利要求1所述的基于时序知识图谱的信息推荐方法,其特征在于,所述使用所述训练样本集训练所述初始信息推荐模型,得到所述训练样本集中训练样本的预估概率包括:
3.根据权利要求2所述的基于时序知识图谱的信息推荐方法,其特征在于,所述时序知识图谱层将所述训练标题表示向量构建为离散时序知识图谱包括:
4.根据权利要求3所述的基于时序知识图谱的信息推荐方法,其特征在于,所述根据所有训练标题表示向量,扩大所述第1个时间片的初始知识图谱,得到所述第1个时间片的时序知识图谱包括:
5.根据权利要求2所述的基于时序知识图谱的信息推荐方法,其特征在于,所述对所述离散时序知识图谱进行邻域聚合,得到聚合后的时序知识图谱的聚合嵌入向量包括:
6.根据权利要求2所述的基于时序知识图谱的信息推荐方法,其特征在于,所述将多个聚合嵌入向量输入所述初始信息推荐模型的评分层,所述评分层将多个聚合嵌入向量拼接,基于注意力机制根据拼接后的多个聚合嵌入向量得到预估概率包括:
7.根据权利
8.根据权利要求1所述的基于时序知识图谱的信息推荐方法,其特征在于,所述根据所述训练候选标题和所述预估概率,得到损失函数值包括:
9.根据权利要求1所述的基于时序知识图谱的信息推荐方法,其特征在于,所述根据历史点击信息中的训练信息标题,以及所述训练信息标题对应的训练候选标题,得到训练样本;根据多个训练样本构建训练样本集包括:
10.一种基于时序知识图谱的信息推荐装置,其特征在于,包括至少一个处理器和存储器,所述至少一个处理器和存储器之间通过数据总线连接,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令在被所述处理器执行后,用于实现权利要求1-9任一所述的基于时序知识图谱的信息推荐方法。
...【技术特征摘要】
1.一种基于时序知识图谱的信息推荐方法,其特征在于,包括:
2.根据权利要求1所述的基于时序知识图谱的信息推荐方法,其特征在于,所述使用所述训练样本集训练所述初始信息推荐模型,得到所述训练样本集中训练样本的预估概率包括:
3.根据权利要求2所述的基于时序知识图谱的信息推荐方法,其特征在于,所述时序知识图谱层将所述训练标题表示向量构建为离散时序知识图谱包括:
4.根据权利要求3所述的基于时序知识图谱的信息推荐方法,其特征在于,所述根据所有训练标题表示向量,扩大所述第1个时间片的初始知识图谱,得到所述第1个时间片的时序知识图谱包括:
5.根据权利要求2所述的基于时序知识图谱的信息推荐方法,其特征在于,所述对所述离散时序知识图谱进行邻域聚合,得到聚合后的时序知识图谱的聚合嵌入向量包括:
6.根据权利要求2所述的基于时序知识图谱的信息推荐方法,其特征在于,所述将多个聚合嵌入向量输入所述初始信息推荐模型的评分层,所述评分层将多个聚合嵌入向量拼接,...
【专利技术属性】
技术研发人员:刘文,伍华凤,白武武,
申请(专利权)人:中国船舶集团有限公司第七〇九研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。