训练交互预测模型、预测交互对象的方法及装置制造方法及图纸

技术编号:26731641 阅读:26 留言:0更新日期:2020-12-15 14:34
本说明书实施例提供一种交互预测模型的训练和使用方法及装置。在该训练方法中,首先基于交互事件序列构建动态交互图,从中确定出对应于当前交互事件的第一节点和第二节点,且第一节点指向参与的上一交互事件对应的两个历史节点。利用图编码网络,获取两个历史节点对应的编码向量;并将编码向量和两个交互事件各自的发生时刻输入预测表征网络,得到第一节点的第一表征向量。此外,还将第二节点的属性特征输入属性编码网络,得到第二属性向量。于是,根据第一表征向量和第二属性向量,预测交互概率,并据此确定损失,更新上述图编码网络,预测表征网络和属性编码网络。

【技术实现步骤摘要】
训练交互预测模型、预测交互对象的方法及装置
本说明书一个或多个实施例涉及机器学习领域,尤其涉及训练交互预测模型,以及利用训练的交互预测模型来预测交互对象的方法和装置。
技术介绍
在许多场景下,需要对用户交互事件进行分析和处理。交互事件是互联网事件的基本组成元素之一,例如,用户浏览页面时的点击行为,可以视为用户与页面内容区块之间的交互事件,电商中的购买行为可以视为用户与商品之间的交互事件,账户间转账行为则是用户与用户之间的交互事件。用户的一系列交互事件中蕴含了用户的细粒度习惯偏好等特点,以及交互对象的特点,是机器学习模型的重要特征来源。因此,在许多场景下,希望根据交互事件对交互参与方进行特征表达和建模,进而对交互对象和事件进行分析,特别是对交互事件的安全性进行分析,从而保障交互平台的安全性。然而,交互事件涉及交互双方,并且各个参与方本身的状态可以是动态变化的,因此,综合考虑交互参与方的多方面特点对其进行准确的特征表达非常困难。由此,希望能有改进的方案,更为有效地对交互对象和交互事件进行分析处理。
技术实现思路
本说明书一个或多个实施例描述了一种交互预测模型的训练方法和装置,其中基于动态交互图,利用对比学习的方式,训练得到交互预测模型,从而可以更准确地针对目标对象预测其未来的交互对象。根据第一方面,提供了一种训练交互预测模型的方法,所述方法包括:获取动态交互图,其中包括多个节点对,每个节点对对应于一个交互事件,其中的两个节点分别表示参与该交互事件的两个对象,任意节点通过连接边指向该节点所代表的对象参与的上一交互事件对应的两个节点;从所述动态交互图中选择对应于第一交互事件的第一节点对,所述第一节点对包括第一节点和第二节点,所述第一交互事件发生于第一时刻;所述第一节点通过连接边指向对应于第二交互事件的第二节点对,所述第二节点对包括第三节点和第四节点,所述第二交互事件发生于第二时刻;利用图编码网络,基于所述动态交互图,获取所述第三节点对应的第三编码向量,所述第四节点对应的第四编码向量;将所述第三编码向量,第四编码向量,第一时刻,第二时刻输入第一预测表征网络,得到所述第一节点在第一时刻的第一表征向量;将所述第二节点对应的对象的属性特征输入第一属性编码网络,得到所述第二节点对应的第二属性向量;根据所述第一表征向量和第二属性向量,得到第一节点与第二节点交互的第一概率,至少根据所述第一概率确定第一预测损失,所述第一预测损失与所述第一概率负相关;以减小所述第一预测损失为目标,更新所述图编码网络,所述第一预测表征网络和所述第一属性编码网络,以训练所述交互预测模型。根据一种实施方式,通过以下方式获取第三节点对应的第三编码向量:以所述第三节点为根节点,在所述动态交互图中确定出从根节点出发,经由连接边到达的预定范围的节点所形成的子图;将所述子图输入所述图编码网络,所述图编码网络根据所述子图中各个节点的节点属性特征以及节点之间的连接关系,输出根节点的隐向量作为所述第三编码向量。进一步的,在一个实施例中,图编码网络可以包括LSTM层,所述LSTM层将所述子图中从叶节点到根节点的各个节点分别作为当前节点,依次迭代处理各个节点,所述迭代处理包括,至少根据当前节点的节点属性特征,以及当前节点通过连接边指向的两个节点的隐向量,确定该当前节点的隐向量。在另一实施例中,图编码网络可以根据所述子图中各个节点之间的连接关系,确定各个节点相对于所述第三节点的注意力权重;然后根据所述注意力权重,对所述各个节点的节点属性特征进行聚合,得到所述第三编码向量。根据一个实施例,得到第一节点在第一时刻的第一表征向量的步骤可以包括:计算所述第一时刻和第二时刻之间的时间差值;将所述第三编码向量,第四编码向量和所述时间差值拼接,得到拼接向量;在所述第一预测表征网络中,利用第一参数矩阵处理所述拼接向量,并对处理结果施加非线性函数,得到所述第一表征向量。根据不同实施例,第一概率可以通过如下方式确定:计算所述第一表征向量和第二属性向量之间的相似度,根据所述相似度得到所述第一概率,所述第一概率正相关于所述相似度;或者,计算所述第一表征向量和第二属性向量之间的距离,根据所述距离得到所述第一概率,所述第一概率负相关于所述距离。根据一个实施例,上述方法还包括,从所述动态交互图中采样多个第一负样本节点,所述第一负样本节点为所述第二节点之外的其他节点;将各个第一负样本节点对应的对象的属性特征分别输入所述第一属性编码网络,得到各个第一负样本节点分别对应的各个第一负样本向量;根据所述第一表征向量和各个第一负样本向量,得到各个第三概率。在这样的情况下,可以根据所述第一概率和各个第三概率,确定第一预测损失,所述第一预测损失与各个第三概率之和正相关。根据一个实施例,所述第二节点通过连接边指向对应于第三交互事件的第三节点对,所述第三节点对包括第五节点和第六节点,所述第三交互事件发生于第三时刻;所述方法还包括:利用所述图编码网络,基于所述动态交互图,获取第五节点对应的第五编码向量,第六节点对应的第六编码向量;将所述第五编码向量,第六编码向量,第一时刻,第三时刻输入所述第一预测表征网络,得到所述第二节点在第一时刻的第二表征向量;将所述第一节点对应的对象的属性特征输入所述第一属性编码网络,得到所述第一节点对应的第一属性向量;根据所述第二表征向量和第一属性向量,得到第二节点与第一节点交互的第二概率,至少根据所述第二概率确定第二预测损失,所述第二预测损失与所述第二概率负相关;以所述第二预测损失减小为目标,更新所述图编码网络,所述第一预测表征网络和所述第一属性编码网络。根据一种实施方式,所述动态交互图中每个节点对中的两个节点分别表示参与该交互事件的第一类对象和第二类对象;所述第一节点属于第一类对象,所述第二节点属于第二类对象。进一步的,在一个实施例中,所述第一类对象和第二类对象分别为用户对象和物品对象;所述用户对象的属性特征包括以下中的至少一项:年龄、职业、教育程度、所在地区、注册时长、人群标签;所述物品对象的属性特征包括以下中的至少一项:物品类别、上架时间、销量、评论数。在一个实施例中,所述第二节点通过连接边指向对应于第三交互事件的第三节点对,所述第三节点对包括第五节点和第六节点,所述第三交互事件发生于第三时刻;所述方法还包括:利用所述图编码网络,基于所述动态交互图,获取第五节点对应的第五编码向量,第六节点对应的第六编码向量;将所述第五编码向量,第六编码向量,第一时刻,第三时刻输入第二预测表征网络,得到所述第二节点在第一时刻的第二表征向量;将所述第一节点对应的对象的属性特征输入第二属性编码网络,得到所述第一节点对应的第一属性向量;根据所述第二表征向量和第一属性向量,得到第二节点与第一节点交互的第二概率,至少根据所述第二概率确定第二预测损失,所述第二预测损失与所述第二概率负相关;以所述第二预测损失减小为目标,更新所述图编码网络,所述第二预测表征网络和所述第二属性编码网络。在一个进本文档来自技高网...

【技术保护点】
1.一种训练交互预测模型的方法,所述方法包括:/n获取动态交互图,其中包括多个节点对,每个节点对对应于一个交互事件,其中的两个节点分别表示参与该交互事件的两个对象,任意节点通过连接边指向该节点所代表的对象参与的上一交互事件对应的两个节点;/n从所述动态交互图中选择对应于第一交互事件的第一节点对,所述第一节点对包括第一节点和第二节点,所述第一交互事件发生于第一时刻;所述第一节点通过连接边指向对应于第二交互事件的第二节点对,所述第二节点对包括第三节点和第四节点,所述第二交互事件发生于第二时刻;/n利用图编码网络,基于所述动态交互图,获取所述第三节点对应的第三编码向量,所述第四节点对应的第四编码向量;/n将所述第三编码向量,第四编码向量,第一时刻,第二时刻输入第一预测表征网络,得到所述第一节点在第一时刻的第一表征向量;/n将所述第二节点对应的对象的属性特征输入第一属性编码网络,得到所述第二节点对应的第二属性向量;/n根据所述第一表征向量和第二属性向量,得到第一节点与第二节点交互的第一概率,至少根据所述第一概率确定第一预测损失,所述第一预测损失与所述第一概率负相关;/n以减小所述第一预测损失为目标,更新所述图编码网络,所述第一预测表征网络和所述第一属性编码网络,以训练所述交互预测模型。/n...

【技术特征摘要】
1.一种训练交互预测模型的方法,所述方法包括:
获取动态交互图,其中包括多个节点对,每个节点对对应于一个交互事件,其中的两个节点分别表示参与该交互事件的两个对象,任意节点通过连接边指向该节点所代表的对象参与的上一交互事件对应的两个节点;
从所述动态交互图中选择对应于第一交互事件的第一节点对,所述第一节点对包括第一节点和第二节点,所述第一交互事件发生于第一时刻;所述第一节点通过连接边指向对应于第二交互事件的第二节点对,所述第二节点对包括第三节点和第四节点,所述第二交互事件发生于第二时刻;
利用图编码网络,基于所述动态交互图,获取所述第三节点对应的第三编码向量,所述第四节点对应的第四编码向量;
将所述第三编码向量,第四编码向量,第一时刻,第二时刻输入第一预测表征网络,得到所述第一节点在第一时刻的第一表征向量;
将所述第二节点对应的对象的属性特征输入第一属性编码网络,得到所述第二节点对应的第二属性向量;
根据所述第一表征向量和第二属性向量,得到第一节点与第二节点交互的第一概率,至少根据所述第一概率确定第一预测损失,所述第一预测损失与所述第一概率负相关;
以减小所述第一预测损失为目标,更新所述图编码网络,所述第一预测表征网络和所述第一属性编码网络,以训练所述交互预测模型。


2.根据权利要求1所述的方法,其中,利用图编码网络,基于所述动态交互图,获取所述第三节点对应的第三编码向量,包括:
以所述第三节点为根节点,在所述动态交互图中确定出从根节点出发,经由连接边到达的预定范围的节点所形成的子图;
将所述子图输入所述图编码网络,所述图编码网络根据所述子图中各个节点的节点属性特征以及节点之间的连接关系,输出根节点的隐向量作为所述第三编码向量。


3.根据权利要求2所述的方法,其中,所述图编码网络包括LSTM层,所述LSTM层将所述子图中从叶节点到根节点的各个节点分别作为当前节点,依次迭代处理各个节点,所述迭代处理包括,至少根据当前节点的节点属性特征,以及当前节点通过连接边指向的两个节点的隐向量,确定该当前节点的隐向量。


4.根据权利要求2所述的方法,其中,所述图编码网络用于,根据所述子图中各个节点之间的连接关系,确定各个节点相对于所述第三节点的注意力权重;
根据所述注意力权重,对所述各个节点的节点属性特征进行聚合,得到所述第三编码向量。


5.根据权利要求1所述的方法,其中,所述得到所述第一节点在第一时刻的第一表征向量,包括:
计算所述第一时刻和第二时刻之间的时间差值;
将所述第三编码向量,第四编码向量和所述时间差值拼接,得到拼接向量;
在所述第一预测表征网络中,利用第一参数矩阵处理所述拼接向量,并对处理结果施加非线性函数,得到所述第一表征向量。


6.根据权利要求1所述的方法,其中,根据所述第一表征向量和第二属性向量,得到第一节点与第二节点交互的第一概率,包括:
计算所述第一表征向量和第二属性向量之间的相似度,根据所述相似度得到所述第一概率,所述第一概率正相关于所述相似度;或者,
计算所述第一表征向量和第二属性向量之间的距离,根据所述距离得到所述第一概率,所述第一概率负相关于所述距离。


7.根据权利要求1所述的方法,还包括,从所述动态交互图中采样多个第一负样本节点,所述第一负样本节点为所述第二节点之外的其他节点;
将各个第一负样本节点对应的对象的属性特征分别输入所述第一属性编码网络,得到各个第一负样本节点分别对应的各个第一负样本向量;
根据所述第一表征向量和各个第一负样本向量,得到各个第三概率;
所述至少根据所述第一概率确定第一预测损失的步骤,包括:
根据所述第一概率和各个第三概率,确定第一预测损失,所述第一预测损失与各个第三概率之和正相关。


8.根据权利要求1所述的方法,其中,所述第二节点通过连接边指向对应于第三交互事件的第三节点对,所述第三节点对包括第五节点和第六节点,所述第三交互事件发生于第三时刻;所述方法还包括:
利用所述图编码网络,基于所述动态交互图,获取第五节点对应的第五编码向量,第六节点对应的第六编码向量;
将所述第五编码向量,第六编码向量,第一时刻,第三时刻输入所述第一预测表征网络,得到所述第二节点在第一时刻的第二表征向量;
将所述第一节点对应的对象的属性特征输入所述第一属性编码网络,得到所述第一节点对应的第一属性向量;
根据所述第二表征向量和第一属性向量,得到第二节点与第一节点交互的第二概率,至少根据所述第二概率确定第二预测损失,所述第二预测损失与所述第二概率负相关;
以所述第二预测损失减小为目标,更新所述图编码网络,所述第一预测表征网络和所述第一属性编码网络。


9.根据权利要求1所述的方法,其中,所述动态交互图中每个节点对中的两个节点分别表示参与该交互事件的第一类对象和第二类对象;
所述第一节点属于第一类对象,所述第二节点属于第二类对象。


10.根据权利要求9所述的方法,其中,所述第一类对象和第二类对象分别为用户对象和物品对象;
所述用户对象的属性特征包括以下中的至少一项:年龄、职业、教育程度、所在地区、注册时长、人群标签;
所述物品对象的属性特征包括以下中的至少一项:物品类别、上架时间、销量、评论数。


11.根据权利要求9所述的方法,其中,所述第二节点通过连接边指向对应于第...

【专利技术属性】
技术研发人员:常晓夫
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1