一种处理推送信息的方法和装置制造方法及图纸

技术编号:39036333 阅读:23 留言:0更新日期:2023-10-10 11:49
本发明专利技术公开了一种处理推送信息的方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:基于待推荐对象的原始对象信息,利用预设的信息生成模型输出对应于多个待推荐对象的推送信息,推送信息包含了多个原始对象信息之间的关联信息,并将推送信息发送给用户端;本发明专利技术的实施例通过挖掘待推荐对象之间的关联性并生成包含关联信息的推送信息,提高了发送给用户端的推送信息的推荐信息量,提高了用户体验。高了用户体验。高了用户体验。

【技术实现步骤摘要】
一种处理推送信息的方法和装置


[0001]本专利技术涉及人工智能
,尤其涉及一种处理推送信息的方法和装置。

技术介绍

[0002]在互联网应用的多种场景中,需要为用户端发送针对推荐对象比如实体物品、虚拟物品、新闻、视频等的推送信息,以达到对推荐对象的推广或者传播的效果。
[0003]目前,往往通过模型比如文本处理模型构建针对推荐对象的推送信息,现有的模型通常是针对单一的推荐对象构建推送信息,无法挖掘多个推荐对象之间的关联性,因此也无法在推送信息中包含多个物品之间的关联信息,导致发送给用户端的推送信息的推荐信息量较低的问题。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种处理推送信息的方法和装置,能够基于待推荐对象的原始对象信息,利用预设的信息生成模型输出对应于多个待推荐对象的推送信息,推送信息包含了多个原始对象信息之间的关联信息,并将推送信息发送给用户端;本专利技术的实施例通过挖掘待推荐对象之间的关联性并生成包含关联信息的推送信息,提高了发送给用户端的推送信息的推荐信息量,提高了用户体验。
[0005]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种处理推送信息的方法,其特征在于,包括:确定多个待推荐对象的原始对象信息;将多个所述原始对象信息,输入预设的信息生成模型;其中,所述预设的信息生成模型通过预设网络模型结合预设损失函数确定出,所述预设网络模型由多个对象样本信息之间的关联信息训练,所述预设损失函数用于评估训练的所述预设网络模型;利用多个所述原始对象信息和所述预设的信息生成模型,生成对应于多个所述原始对象信息的推送信息;其中,所述推送信息包含多个所述原始对象信息之间的关联信息,以将所述推送信息发送给用户端。
[0006]可选地,所述预设网络模型包括训练出的编码器和训练出的解码器;所述生成对应于多个所述原始对象信息的推送信息,包括:将所述多个原始对象信息输入所述训练出的编码器,生成第一隐层序列;利用所述训练出的解码器、所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列;结合所述第一隐层序列以及所述第二隐层序列,计算推送信息的解码概率;基于计算出的所述解码概率,确定出对应于多个所述原始对象信息的推送信息。
[0007]可选地,所述训练出的解码器设置有预设初始向量;所述预设初始向量为结合所述原始对象信息包含的图像信息以及描述信息所构建出的;所述生成第二隐层序列,包括:利用所述训练出的解码器、所述训练出的解码器包含的所述预设初始向量,结合所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列。
[0008]可选地,所述处理推送信息的方法,还包括:获取所述原始对象信息包含的描述信息以及图像信息;分别利用所述描述信息和所述图像信息为所述原始对象信息转换出文本
向量和图像向量;利用平均池化模型对所述图像向量执行降维操作;根据所述原始对象信息包含的描述信息以及图像信息,确定指示文本和图像的影响程度的权重值;利用所述权重值、所述文本向量以及降维后的图像向量,构建出设置于所述解码器内的预设初始向量。
[0009]可选地,所述处理推送信息的方法,进一步包括:所述预设损失函数通过强化学习损失函数和极大似然函数进行线性叠加得到;其中,所述强化学习损失函数包含针对每一个训练周期得到的训练结果包含的关联信息的关联奖励函数;在训练所述预设的推荐模型的过程中,利用所述强化学习损失函数包含的关联奖励函数以及所述极大似然函数,评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果。
[0010]可选地,所述处理推送信息的方法,进一步包括:所述强化学习损失函数包含所述关联奖励函数以及预设奖励损失函数;利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数;其中,所述关联信息通过模型解码贪心搜索算法和/或模型后验概率采样算法从每一个所述训练周期的训练结果中确定出;所述评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果,包括:结合所述奖励系数以及所述预设奖励损失函数,评估训练的所述预设网络模型针对多个所述对象样本信息输出每一个训练周期得到的训练结果。
[0011]可选地,所述处理推送信息的方法,进一步包括:针对通过模型解码贪心搜索算法或模型后验概率采样算法确定出每一个所述训练周期的训练结果包含的关联信息的情况下,所述利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数,包括:利用关联奖励函数确定每一个所述训练周期的训练结果包含的关联信息的数量与所述初始关联信息的数量之间的比值为每一个所述训练周期的奖励系数。
[0012]可选地,所述处理推送信息的方法,进一步包括:在通过模型解码贪心搜索算法和模型后验概率采样算法确定出每一个所述训练周期的训练结果包含的关联信息的情况下,所述利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始关联信息构建出的奖励系数,包括:利用关联奖励函数计算所述模型解码贪心搜索算法确定出每一个所述训练周期的关联信息与所述模型后验概率采样算法确定出每一个所述训练周期的关联信息之间的差别信息;确定每一个所述训练周期的差别信息的数量与所述初始关联信息的数量之间的比值为每一个所述训练周期的奖励系数。
[0013]为实现上述目的,根据本专利技术实施例的第二方面,提供了一种处理推送信息的装置,其特征在于,包括:确定信息模块、获取模型模块和推送信息模块;其中,
[0014]所述确定信息模块,用于确定多个待推荐对象的原始对象信息;
[0015]所述获取模型模块,用于将多个所述原始对象信息,输入预设的信息生成模型;其中,所述预设的信息生成模型通过预设网络模型结合预设损失函数确定出,所述预设网络模型由多个对象样本信息之间的关联信息训练,所述预设损失函数用于评估训练的所述预设网络模型;
[0016]所述推送信息模块,用于利用多个所述原始对象信息和所述预设的信息生成模型,生成对应于多个所述原始对象信息的推送信息;其中,所述推送信息包含多个所述原始对象信息之间的关联信息,以将所述推送信息发送给用户端。
[0017]可选地,所述处理推送信息的装置包含的所述预设网络模型包括训练出的编码器
和训练出的解码器;所述生成对应于多个所述原始对象信息的推送信息,包括:将所述多个原始对象信息输入所述训练出的编码器,生成第一隐层序列;利用所述训练出的解码器、所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列;结合所述第一隐层序列以及所述第二隐层序列,计算推送信息的解码概率;基于计算出的所述解码概率,确定出对应于多个所述原始对象信息的推送信息。
[0018]可选地,所述处理推送信息的装置包含的所述训练出的解码器设置有预设初始向量;所述预设初始向量为结合所述原始对象信息包含的图像信息以及描述信息所构建出的;所述生成第二隐层序列,包括:利用所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种处理推送信息的方法,其特征在于,包括:确定多个待推荐对象的原始对象信息;将多个所述原始对象信息,输入预设的信息生成模型;其中,所述预设的信息生成模型通过预设网络模型结合预设损失函数确定出,所述预设网络模型由多个对象样本信息之间的关联信息训练,所述预设损失函数用于评估训练的所述预设网络模型;利用多个所述原始对象信息和所述预设的信息生成模型,生成对应于多个所述原始对象信息的推送信息;其中,所述推送信息包含多个所述原始对象信息之间的关联信息,以将所述推送信息发送给用户端。2.根据权利要求1所述的方法,其特征在于,所述预设网络模型包括训练出的编码器和训练出的解码器;所述生成对应于多个所述原始对象信息的推送信息,包括:将所述多个原始对象信息输入所述训练出的编码器,生成第一隐层序列;利用所述训练出的解码器、所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列;结合所述第一隐层序列以及所述第二隐层序列,计算推送信息的解码概率;基于计算出的所述解码概率,确定出对应于多个所述原始对象信息的推送信息。3.根据权利要求2所述的方法,其特征在于,所述训练出的解码器设置有预设初始向量;所述预设初始向量为结合所述原始对象信息包含的图像信息以及描述信息所构建出的;所述生成第二隐层序列,包括:利用所述训练出的解码器、所述训练出的解码器包含的所述预设初始向量,结合所述第一隐层序列以及针对至少一种所述待推荐对象的预设参考推送信息,生成第二隐层序列。4.根据权利要求3所述的方法,其特征在于,还包括:获取所述原始对象信息包含的描述信息以及图像信息;分别利用所述描述信息和所述图像信息为所述原始对象信息转换出文本向量和图像向量;利用平均池化模型对所述图像向量执行降维操作;根据所述原始对象信息包含的描述信息以及图像信息,确定指示文本和图像的影响程度的权重值;利用所述权重值、所述文本向量以及降维后的图像向量,构建出设置于所述解码器内的预设初始向量。5.根据权利要求1所述的方法,其特征在于,进一步包括:所述预设损失函数通过强化学习损失函数和所述极大似然函数进行线性叠加得到;其中,所述强化学习损失函数包含针对每一个训练周期得到的训练结果包含的关联信息的关联奖励函数;在训练所述预设的推荐模型的过程中,利用所述强化学习损失函数包含的关联奖励函数以及所述极大似然函数,评估训练的所述预设网络模型针对多个所述对象样本信息输出
每一个训练周期得到的训练结果。6.根据权利要求5所述的方法,其特征在于,进一步包括:所述强化学习损失函数包含所述关联奖励函数以及预设奖励损失函数;利用关联奖励函数确定每一个所述训练结果中包含的关联信息与初始...

【专利技术属性】
技术研发人员:李浩然吴友政
申请(专利权)人:北京京东尚科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1