【技术实现步骤摘要】
利用LSTM神经网络模型处理交互数据的方法及装置
本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习处理交互数据的方法和装置。
技术介绍
在许多场景下,需要对用户交互事件进行分析和处理。交互事件是互联网事件的基本组成元素之一,例如,用户浏览页面时的点击行为,可以视为用户与页面内容区块之间的交互事件,电商中的购买行为可以视为用户与商品之间的交互事件,账户间转账行为则是用户与用户之间的交互事件。用户的一系列交互事件中蕴含了用户的细粒度习惯偏好等特点,以及交互对象的特点,是机器学习模型的重要特征来源。因此,在许多场景下,希望根据交互事件对交互参与方进行特征表达和建模。然而,交互事件涉及交互双方,并且各个参与方本身的状态可以是动态变化的,因此,综合考虑交互参与方的多方面特点对其进行准确的特征表达非常困难。由此,希望能有改进的方案,更为有效地对交互事件中的交互对象进行分析处理,以得到适于后续业务分析的特征向量。
技术实现思路
本说明书一个或多个实施例描述了处理交互数据的方法和装置,其中利用LSTM神经网络模型,考虑交互对象参与的交互事件以及交互事件中其他对象的影响,将交互对象处理为隐含特征,从而进行后续业务处理分析。根据第一方面,提供了一种处理交互数据的方法,所述方法包括:获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括,发生交互行为的两个对象和交互时间;所述动态交互图包括任意的第一节点,所述第一节点对应于发生在第一时间的交互 ...
【技术保护点】
1.一种处理交互数据的方法,所述方法包括:/n获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括,发生交互行为的两个对象和交互时间;所述动态交互图包括任意的第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连接边指向N个关联事件所对应的M个关联节点,所述N个关联事件均发生于第二时间,且均包含所述第一对象作为交互对象之一,所述第二时间为,从所述第一时间向前回溯,所述第一对象发生交互行为的前一时间;所述动态交互图中包括至少一个关联节点数目大于2的多元节点;/n在所述动态交互图中,确定与待分析的当前节点对应的当前子图,所述当前子图包括从当前节点出发,经由连接边到达的预定范围内的节点;/n将所述当前子图输入神经网络模型,所述神经网络模型包括LSTM层,所述LSTM层根据所述当前子图中各个节点之间的连接边的指向关系,依次迭代处理各个节点,从而得到所述当前节点的隐含向量;其中所述各个节点包括第二节点,所述依次迭代处理各个节点包括,至少根据所述第二节点的节点特征,该第二节点所指向的k个关联节点各自的中间向量和隐含向量,确定所 ...
【技术特征摘要】
1.一种处理交互数据的方法,所述方法包括:
获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括,发生交互行为的两个对象和交互时间;所述动态交互图包括任意的第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连接边指向N个关联事件所对应的M个关联节点,所述N个关联事件均发生于第二时间,且均包含所述第一对象作为交互对象之一,所述第二时间为,从所述第一时间向前回溯,所述第一对象发生交互行为的前一时间;所述动态交互图中包括至少一个关联节点数目大于2的多元节点;
在所述动态交互图中,确定与待分析的当前节点对应的当前子图,所述当前子图包括从当前节点出发,经由连接边到达的预定范围内的节点;
将所述当前子图输入神经网络模型,所述神经网络模型包括LSTM层,所述LSTM层根据所述当前子图中各个节点之间的连接边的指向关系,依次迭代处理各个节点,从而得到所述当前节点的隐含向量;其中所述各个节点包括第二节点,所述依次迭代处理各个节点包括,至少根据所述第二节点的节点特征,该第二节点所指向的k个关联节点各自的中间向量和隐含向量,确定所述第二节点的隐含向量和中间向量;
根据所述当前节点的隐含向量,进行与所述当前节点相关的业务处理。
2.根据权利要求1所述的方法,其中,所述对象包括用户,所述交互事件包括以下中的至少一种:点击事件,社交事件,交易事件。
3.根据权利要求1所述的方法,其中,
所述M个关联节点为2N个节点,分别对应于所述N个关联事件中各个关联事件所包括的两个对象;或者,
所述M个关联节点为N+1个节点,分别对应于所述N个关联事件中与所述第一对象交互的N个其他对象,以及所述第一对象自身。
4.根据权利要求1所述的方法,其中,所述预定范围内的节点包括:
预设阶数K的连接边之内的节点;和/或
交互时间在预设时间范围内的节点。
5.根据权利要求1所述的方法,其中,所述每个交互事件还包括,交互行为的行为特征;
所述第二节点的节点特征包括,所述第二节点所对应的对象的属性特征,以及所述第二节点在所对应的交互时间中参与的交互事件的行为特征。
6.根据权利要求1所述的方法,其中,所述确定所述第二节点的隐含向量和中间向量包括:
将所述第二节点的节点特征,分别与所述k个关联节点对应的k个隐含向量组合,输入算法相同、参数不同的第一变换函数和第二变换函数,分别得到k个第一变换向量和k个第二变换向量;
将所述k个关联节点中第i关联节点的中间向量,与对应的第i个第一变换向量,第i个第二变换向量进行组合操作,得到k个操作结果,将该k个操作结果求和,得到组合向量;
将所述第二节点的节点特征连同所述k个隐含向量,分别输入第三变换函数和第四变换函数,分别得到第三变换向量和第四变换向量;
基于所述组合向量和第三变换向量,确定所述第二节点的中间向量;
基于所述第二节点的中间向量和第四变换向量,确定所述第二节点的隐含向量。
7.根据权利要求1所述的方法,其中,所述依次迭代处理各个节点包括,根据所述第二节点的节点特征,该第二节点所指向的k个关联节点各自的中间向量和隐含向量,以及该第二节点对应的交互时间与所述k个关联节点对应的交互时间之间的时间差,确定所述第二节点的隐含向量和中间向量。
8.根据权利要求7所述的方法,其中,所述确定所述第二节点的隐含向量和中间向量包括:
将所述第二节点的节点特征和所述时间差,与所述k个关联节点对应的k个隐含向量分别组合,输入第一变换函数,得到k个第一变换向量;
将所述第二节点的节点特征与所述k个关联节点对应的k个隐含向量分别组合,输入第二变换函数,得到k个第二变换向量;
将所述k个关联节点中第i关联节点的中间向量,与对应的第i第一变换向量,第i第二变换向量进行组合操作,得到k个操作结果,将该k个操作结果求和,得到组合向量;
将所述第二节点的节点特征连同所述k个隐含向量,分别输入第三变换函数和第四变换函数,分别得到第三变换向量和第四变换向量;
基于所述组合向量和第三变换向量,确定所述第二节点的中间向量;
基于所述第二节点的中间向量和第四变换向量,确定所述第二节点的隐含向量。
9.根据权利要求7所述的方法,其中,所述确定所述第二节点的隐含向量和中间向量包括:
将所述第二节点的节点特征和所述时间差,与所述k个关联节点对应的k个隐含向量分别组合后,输入算法相同、参数不同的第一变换函数和第二变换函数,分别得到k个第一变换向量和k个第二变换向量;
将所述k个关联节点中第i关联节点的中间向量,与对应的第i第一变换向量,第i第二变换向量进行组合操作,得到k个操作结果,将该k个操作结果求和,得到组合向量;
将所述第二节点的节点特征连同所述k个隐含向量,分别输入第三变换函数和第四变换函数,分别得到第三变换向量和第四变换向量;
基于所述组合向量和第三变换向量,确定所述第二节点的中间向量;
基于所述第二节点的中间向量和第四变换向量,确定所述第二节点的隐含向量。
10.根据权利要求1所述的方法,其中,所述神经网络模型包括多个LSTM层,其中,上一LSTM层确定出的所述第二节点的隐含向量,输入到下一LSTM层作为该第二节点的节点特征。
11.根据权利要求10所述的方法,其中,所述神经网络模型将所述多个LSTM层各自输出的当前节点的隐含向量进行综合,得到所述当前节点的最终隐含向量。
12.根据权利要求10所述的方法,其中,所述神经网络模型将所述多个LSTM层中最后一个LSTM层输出的当前节点的隐含向量,作为所述当前节点的最终隐含向量。
13.根据权利要求1所述的方法,其中,所述神经网络模型通过以下方式训练:
获取历史交互事件,其中包括第一样本对象和第二样本对象;
在所述动态交互图中,分别确定与所述第一样本对象对应的第一子图,和与所述第二样本对象对应的第二子图;
将所述第一子图和所述第二子图分别输入所述神经网络模型,分别得到所述第一样本对象的隐含向量和第二样本对象的隐含向量;
根据所述第一样本对象的隐含向量和第二样本对象的隐含向量,预测所述第一样本对象和第二样本对象是否会发生交互,得到预测结果;
根据所述预测结果,确定预测损失;
根据所述预测损失,更新所述神经网络模型。
14.根据权利要求1所述的方法,其中,所述神经网络模型通过以下方式训练:
从所述交互事件集涉及的多个样本对象中选择样本对象,并获取该样本对象的分类标签;
在所述动态交互图中,确定与该样本对象对应的样本子图;
将所述样本子图输入所述神经网络模型,得到所述样本对象的隐含向量;
根据所述样本对象的隐含向量,预测所述样本对象的分类,得到预测结果;
根据所述预测结果和所述分类标签,确定预测损失;
根据所述预测损失,更新所述神经网络模型。
15.一种处理交互数据的装置,所述装置包括:
交互图获取单元,配置为获取根据交互事件集构建的动态交互图,其中,所述交互事件集包括多个交互事件,每个交互事件至少包括,发生交互行为的两个对象和交互时间;所述动态交互图包括任意的第一节点,所述第一节点对应于发生在第一时间的交互事件中的第一对象,所述第一节点通过连...
【专利技术属性】
技术研发人员:常晓夫,文剑烽,刘旭钦,宋乐,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。