处理交互序列数据的方法及装置制造方法及图纸

技术编号:22755433 阅读:21 留言:0更新日期:2019-12-07 04:07
本说明书实施例提供一种处理交互序列数据的方法和装置。在该方法中,首先获取根据动态交互序列构建的动态交互图,其中动态交互序列包括按照时间顺序排列的多个交互特征组,动态交互图包括代表各个交互特征组中各个交互对象的节点,任意节点通过连接边指向代表相关特征组中包含的两个对象的两个节点。然后,在动态交互图中,确定与待分析的当前节点对应的当前子图,并将当前子图输入神经网络模型进行处理。神经网络模型包括LSTM层,LSTM层根据当前子图中各个节点之间的连接边的指向关系,依次迭代处理各个节点,从而得到当前节点的隐含向量。

Methods and devices for processing interactive sequential data

The embodiment of the specification provides a method and a device for processing interactive sequence data. In this method, firstly, the dynamic interaction graph is constructed according to the dynamic interaction sequence. The dynamic interaction sequence includes multiple interaction feature groups arranged in chronological order. The dynamic interaction graph includes nodes representing each interaction object in each interaction feature group. Any node points to two nodes representing two objects in the relevant feature group through the connection edge. Then, in the dynamic interaction graph, the current sub graph corresponding to the current node to be analyzed is determined, and the current sub graph is input into the neural network model for processing. The neural network model includes the LSTM layer. The LSTM layer iteratively processes each node according to the direction relationship of the connection edge between each node in the current subgraph, so as to obtain the hidden vector of the current node.

【技术实现步骤摘要】
处理交互序列数据的方法及装置
本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习处理交互序列数据的方法和装置。
技术介绍
在许多场景下,需要对用户交互事件进行分析和处理。交互事件是互联网事件的基本组成元素之一,例如,用户浏览页面时的点击行为,可以视为用户与页面内容区块之间的交互事件,电商中的购买行为可以视为用户与商品之间的交互事件,账户间转账行为则是用户与用户之间的交互事件。用户的一系列交互事件中蕴含了用户的细粒度习惯偏好等特点,以及交互对象的特点,是机器学习模型的重要特征来源。因此,在许多场景下,希望根据交互事件对交互参与方进行特征表达和建模。然而,交互事件涉及交互双方,并且各个参与方本身的状态可以是动态变化的,因此,综合考虑交互参与方的多方面特点对其进行准确的特征表达非常困难。由此,希望能有改进的方案,更为有效地对交互事件中的交互对象进行分析处理,以得到适于后续分析的特征向量。
技术实现思路
本说明书一个或多个实施例描述了处理交互序列数据的方法和装置,其中利用神经网络模型,考虑交互对象参与的交互事件以及交互事件中其他对象的影响,将交互对象处理为隐含特征,从而得到有利于后续分析的特征向量。根据第一方面,提供了一种处理交互序列数据的方法,所述方法包括:获取根据动态交互序列构建的动态交互图,其中,所述动态交互序列包括按照时间顺序排列的多个交互特征组,每个交互特征组至少包括,发生交互行为的第一对象,第二对象和交互时间;所述动态交互图包括代表各个交互特征组中的各个第一对象和第二对象的多个节点,其中,任意节点i通过连接边,指向代表相关特征组中包含的两个对象的两个节点,所述相关特征组为,在所述动态交互序列中从该节点i所在的交互特征组向前回溯,得到的同样包含该节点i代表的对象的第一个交互特征组;在所述动态交互图中,确定与待分析的当前节点对应的当前子图,所述当前子图包括从当前节点出发,经由连接边到达的预定范围内的节点;将所述当前子图输入神经网络模型,所述神经网络模型包括LSTM层,所述LSTM层根据所述当前子图中各个节点之间的连接边的指向关系,依次迭代处理各个节点,从而得到所述当前节点的隐含向量;其中所述各个节点包括第一节点,所述依次迭代处理各个节点包括,至少根据所述第一节点的节点特征,该第一节点所指向的两个节点各自的中间向量和隐含向量,确定所述第一节点的隐含向量和中间向量。在一个实施例中,如下获取动态交互图:获取基于已有交互序列构建的已有动态交互图;获取新增交互特征组;将该新增交互特征组中包括的第一对象和第二对象作为两个新增节点,添加到所述已有动态交互图中;对于每个新增节点,确定其相关特征组,添加从该新增节点指向其相关特征组中包含的两个节点的连接边。在另一实施例中,如下获取动态交互图:获取基于已有交互序列构建的已有动态交互图;获取新增交互序列,其中包括多个新增交互特征组;对于每个新增交互特征组,将其中的第一对象和第二对象作为两个新增节点,添加到所述已有动态交互图中;对于每个新增节点,确定其相关特征组,添加从该新增节点指向其相关特征组中包含的两个节点的连接边。在一个实施例中,所述当前节点是这样的节点:在所述动态交互图中,不存在指向该节点的连接边。在一个实施例中,所述预定范围内的节点包括:预设数目K的连接边之内的节点;和/或,交互时间在预设时间范围内的节点。根据一种实施方式,每个交互特征组还包括,交互行为的行为特征;在这样的情况下,所述第一节点的节点特征包括,所述第一节点所对应的对象的属性特征,以及所述第一节点所在的交互特征组中的行为特征。在一种实施方式中,第一节点所指向的两个节点为第一指向节点和第二指向节点;LSTM层通过以下方式确定所述第一节点的隐含向量和中间向量:将所述第一节点的节点特征、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入算法相同、参数不同的第一变换函数和第二变换函数,分别得到第一变换向量和第二变换向量;将第一变换向量和第二变换向量分别与第一指向节点的中间向量和第二指向节点的中间向量进行组合操作,基于操作结果得到组合向量;将所述第一节点的节点特征、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入第三变换函数和第四变换函数,分别得到第三变换向量和第四变换向量;基于所述组合向量和第三变换向量,确定所述第一节点的中间向量;基于所述第一节点的中间向量和第四变换向量,确定所述第一节点的隐含向量。在另一种实施方式中,所述LSTM层依次迭代处理各个节点包括,根据所述第一节点的节点特征,该第一节点所指向的两个节点各自的中间向量和隐含向量,以及该第一节点所在交互特征组中的第一交互时间与所指向的两个节点所在交互特征组中的第二交互时间之间的时间差,确定所述第一节点的隐含向量和中间向量。进一步地,LSTM层通过以下方式确定第一节点的隐含向量和中间向量:将所述第一节点的节点特征、所述时间差、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入算法相同、参数不同的第一变换函数和第二变换函数,分别得到第一变换向量和第二变换向量;将第一变换向量和第二变换向量分别与第一指向节点的中间向量和第二指向节点的中间向量进行组合,得到组合向量;将所述第一节点的节点特征、所述时间差、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入第三变换函数和第四变换函数,分别得到第三变换向量和第四变换向量;基于所述组合向量和第三变换向量,确定所述第一节点的中间向量;基于所述第一节点的中间向量和第四变换向量,确定所述第一节点的隐含向量。根据一种实施方式,神经网络模型包括多个LSTM层,其中,上一LSTM层确定出的所述第一节点的隐含向量,输入到下一LSTM层作为该第一节点的节点特征。进一步地,在一个实施例中,所述神经网络模型将所述多个LSTM层各自输出的当前节点的隐含向量进行综合,得到所述当前节点的最终隐含向量。在另一实施例中,所述神经网络模型将所述多个LSTM层中最后一个LSTM层输出的当前节点的隐含向量,作为所述当前节点的最终隐含向量。根据一种实施方式,所述神经网络模型通过以下方式训练:获取历史交互特征组,其中包括第一样本对象和第二样本对象;在所述动态交互图中,分别确定与所述第一样本对象对应的第一子图,和与所述第二样本对象对应的第二子图;将所述第一子图和所述第二子图分别输入所述神经网络模型,分别得到所述第一样本对象的隐含向量和第二样本对象的隐含向量;根据所述第一样本对象的隐含向量和第二样本对象的隐含向量,预测所述第一样本对象和第二样本对象是否会发生交互,得到预测结果;根据所述预测结果,确定预测损失;根据所述预测损失,更新所述神经网络模型。根据另一种实施方式,所述神经网络模型通过以下方式训练:从所述动态交互序本文档来自技高网...

【技术保护点】
1.一种处理交互序列数据的方法,所述方法包括:/n获取根据动态交互序列构建的动态交互图,其中,所述动态交互序列包括按照时间顺序排列的多个交互特征组,每个交互特征组至少包括,发生交互行为的第一对象,第二对象和交互时间;所述动态交互图包括代表各个交互特征组中的各个第一对象和第二对象的多个节点,其中,任意节点i通过连接边,指向代表相关特征组中包含的两个对象的两个节点,所述相关特征组为,在所述动态交互序列中从该节点i所在的交互特征组向前回溯,得到的同样包含该节点i代表的对象的第一个交互特征组;/n在所述动态交互图中,确定与待分析的当前节点对应的当前子图,所述当前子图包括从当前节点出发,经由连接边到达的预定范围内的节点;/n将所述当前子图输入神经网络模型,所述神经网络模型包括LSTM层,所述LSTM层根据所述当前子图中各个节点之间的连接边的指向关系,依次迭代处理各个节点,从而得到所述当前节点的隐含向量;其中所述各个节点包括第一节点,所述依次迭代处理各个节点包括,至少根据所述第一节点的节点特征,该第一节点所指向的两个节点各自的中间向量和隐含向量,确定所述第一节点的隐含向量和中间向量。/n

【技术特征摘要】
1.一种处理交互序列数据的方法,所述方法包括:
获取根据动态交互序列构建的动态交互图,其中,所述动态交互序列包括按照时间顺序排列的多个交互特征组,每个交互特征组至少包括,发生交互行为的第一对象,第二对象和交互时间;所述动态交互图包括代表各个交互特征组中的各个第一对象和第二对象的多个节点,其中,任意节点i通过连接边,指向代表相关特征组中包含的两个对象的两个节点,所述相关特征组为,在所述动态交互序列中从该节点i所在的交互特征组向前回溯,得到的同样包含该节点i代表的对象的第一个交互特征组;
在所述动态交互图中,确定与待分析的当前节点对应的当前子图,所述当前子图包括从当前节点出发,经由连接边到达的预定范围内的节点;
将所述当前子图输入神经网络模型,所述神经网络模型包括LSTM层,所述LSTM层根据所述当前子图中各个节点之间的连接边的指向关系,依次迭代处理各个节点,从而得到所述当前节点的隐含向量;其中所述各个节点包括第一节点,所述依次迭代处理各个节点包括,至少根据所述第一节点的节点特征,该第一节点所指向的两个节点各自的中间向量和隐含向量,确定所述第一节点的隐含向量和中间向量。


2.根据权利要求1所述的方法,其中,所述获取根据动态交互序列构建的动态交互图包括:
获取基于已有交互序列构建的已有动态交互图;
获取新增交互特征组;
将该新增交互特征组中包括的第一对象和第二对象作为两个新增节点,添加到所述已有动态交互图中;
对于每个新增节点,确定其相关特征组,添加从该新增节点指向其相关特征组中包含的两个节点的连接边。


3.根据权利要求1所述的方法,其中,所述获取根据动态交互序列构建的动态交互图包括:
获取基于已有交互序列构建的已有动态交互图;
获取新增交互序列,其中包括多个新增交互特征组;
对于每个新增交互特征组,将其中的第一对象和第二对象作为两个新增节点,添加到所述已有动态交互图中;
对于每个新增节点,确定其相关特征组,添加从该新增节点指向其相关特征组中包含的两个节点的连接边。


4.根据权利要求1所述的方法,其中,所述当前节点是这样的节点:在所述动态交互图中,不存在指向该节点的连接边。


5.根据权利要求1所述的方法,其中,所述预定范围内的节点包括:
预设数目K的连接边之内的节点;和/或
交互时间在预设时间范围内的节点。


6.根据权利要求1所述的方法,其中,所述每个交互特征组还包括,交互行为的行为特征;
所述第一节点的节点特征包括,所述第一节点所对应的对象的属性特征,以及所述第一节点所在的交互特征组中的行为特征。


7.根据权利要求1所述的方法,其中,所述第一节点所指向的两个节点为第一指向节点和第二指向节点;所述确定所述第一节点的隐含向量和中间向量包括:
将所述第一节点的节点特征、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入算法相同、参数不同的第一变换函数和第二变换函数,分别得到第一变换向量和第二变换向量;
将第一变换向量和第二变换向量分别与第一指向节点的中间向量和第二指向节点的中间向量进行组合操作,基于操作结果得到组合向量;
将所述第一节点的节点特征、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入第三变换函数和第四变换函数,分别得到第三变换向量和第四变换向量;
基于所述组合向量和第三变换向量,确定所述第一节点的中间向量;
基于所述第一节点的中间向量和第四变换向量,确定所述第一节点的隐含向量。


8.根据权利要求1所述的方法,其中,所述依次迭代处理各个节点包括,根据所述第一节点的节点特征,该第一节点所指向的两个节点各自的中间向量和隐含向量,以及该第一节点所在交互特征组中的第一交互时间与所指向的两个节点所在交互特征组中的第二交互时间之间的时间差,确定所述第一节点的隐含向量和中间向量。


9.根据权利要求7所述的方法,其中,所述确定所述第一节点的隐含向量和中间向量包括:
将所述第一节点的节点特征、所述时间差、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入算法相同、参数不同的第一变换函数和第二变换函数,分别得到第一变换向量和第二变换向量;
将第一变换向量和第二变换向量分别与第一指向节点的中间向量和第二指向节点的中间向量进行组合,得到组合向量;
将所述第一节点的节点特征、所述时间差、第一指向节点的隐含向量和第二指向节点的隐含向量,分别输入第三变换函数和第四变换函数,分别得到第三变换向量和第四变换向量;
基于所述组合向量和第三变换向量,确定所述第一节点的中间向量;
基于所述第一节点的中间向量和第四变换向量,确定所述第一节点的隐含向量。


10.根据权利要求1所述的方法,其中,所述神经网络模型包括多个LSTM层,其中,上一LSTM层确定出的所述第一节点的隐含向量,输入到下一LSTM层作为该第一节点的节点特征。


11.根据权利要求10所述的方法,其中,所述神经网络模型将所述多个LSTM层各自输出的当前节点的隐含向量进行综合,得到所述当前节点的最终隐含向量。


12.根据权利要求10所述的方法,其中,所述神经网络模型将所述多个LSTM层中最后一个LSTM层输出的当前节点的隐含向量,作为所述当前节点的最终隐含向量。


13.根据权利要求1所述的方法,其中,所述神经网络模型通过以下方式训练:
获取历史交互特征组,其中包括第一样本对象和第二样本对象;
在所述动态交互图中,分别确定与所述第一样本对象对应的第一子图,和与所述第二样本对象对应的第二子图;
将所述第一子图和所述第二子图分别输入所述神经网络模型,分别得到所述第一样本对象的隐含向量和第二样本对象的隐含向量;
根据所述第一样本对象的隐含向量和第二样本对象的隐含向量,预测所述第一样本对象和第二样本对象是否会发生交互,得到预测结果;
根据所述预测结果,确定预测损失;
根据所述预测损失,更新所述神经网络模型。


14.根据权利要求1所述的方法,其中,所述神经网络模型通过以下方式训练:
从所述动态交互序列中选择样本对象,并获取该样本对象的分类标签;
在所述动态交互图中,确定与该样本对象对应的样本子图;
将所述样本子图输入所述神经网络模型,得到所述样本对象的隐含向量;
根据所述样本对象的隐含向量,预测所述样本对象的分类,得到预测结果;
根据所述预测结果和所述分类标签,确定预测损失;
根据所述预测损失,更新所述神经网络模型。


15.一种处理交互序列数据的装置,所述装置包括:
交互图获取单元,配置为获取根据动态交互序列构建的动态交互图,其中,所述动态交互序列包括按照时间顺序排列的多个交互特征组,每个交互特征组至少包括,发生交互行为的第一对象,第二对象和交互时间;所述动态交互图包括代表各个交互特征组中的各个第一对象和第二对象的多个节...

【专利技术属性】
技术研发人员:文剑烽常晓夫宋乐刘旭钦
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1