行为预测系统的更新方法及装置、存储介质和计算设备制造方法及图纸

技术编号：27194733 阅读：17 留言：0更新日期：2021-01-31 11:45

本说明书实施例提供一种行为预测系统的更新方法，该方法包括：获取训练样本对，其中包括对应同一用户的源域样本和目标域样本，各域样本包括对应域的当前对象，用户已做出特定行为的M个历史对象，以及指示该用户是否对该当前对象做出特定行为的行为标签；将训练样本对输入行为预测系统，在其中的源域编码层和目标域编码层采用联合注意力机制，编码得到源域当前对象向量和M个源域历史对象向量，以及目标域当前对象向量和M个目标域历史对象向量；基于2M个历史对象向量，分别进行第一融合和第二融合，对应得到源域用户向量和目标域用户向量；基于各域用户向量和各域当前对象向量，确定各域行为预测结果，进而结合各域行为标签，更新行为预测系统。更新行为预测系统。更新行为预测系统。

全部详细技术资料下载

【技术实现步骤摘要】
行为预测系统的更新方法及装置、存储介质和计算设备

[0001]本说明书实施例涉及计算机
，尤其涉及一种行为预测系统的更新方法及装置。

技术介绍

[0002]当今，人们越来越频繁地使用服务平台向用户提供的多种多样的服务，相应地，为了提高用户的服务体验，服务平台可以利用机器学习模型对用户在使用服务时的相关行为进行预测，进而根据预测结果为用户定制服务方案。例如，新闻资讯网站可以通过预测某用户针对各类新闻板块的点击概率，确定向该用户推送的新闻资讯页面中所包括新闻板块的类别和排序。又例如，购物网站可以通过预测某用户针对某一商品的喜好程度，确定是否向该用户推荐该商品。
[0003]显然，希望针对用户行为的预测结果越准确越好。然而，目前预测用户行为的方式较为单一，得到的预测结果准确度也十分有限。因此，需要提出一种合理的方案，可以有效提高用户行为预测结果的准确性。

技术实现思路

[0004]在本说明书描述的行为预测系统的更新方法及装置中，充分利用用户在源域和目标域的数据，采用联合注意力机制对用户行为进行建模，从而利用学习到的细粒度用户偏好表达，提升用户在两个域，尤其是目标域内行为预测结果的准确性。
[0005]根据第一方面，提供一种行为预测系统的更新方法，包括：获取训练样本对，其中包括对应同一用户的源域样本和目标域样本，各域样本包括对应域的当前对象，用户已做出特定行为的M个历史对象，以及指示该用户是否对该当前对象做出特定行为的行为标签。将所述训练样本对输入所述行为预测系统，该行为预测系统包括源域...

【技术保护点】

【技术特征摘要】
1.一种行为预测系统的更新方法，包括：获取训练样本对，其中包括对应同一用户的源域样本和目标域样本，各域样本包括对应域的当前对象，用户已做出特定行为的M个历史对象，以及指示该用户是否对该当前对象做出特定行为的行为标签；将所述训练样本对输入所述行为预测系统，该行为预测系统包括源域编码层和目标域编码层；其中，所述源域编码层针对源域样本中的M+1个源域对象，基于目标域样本中M+1个目标域对象确定源域注意力，从而编码得到源域当前对象向量和M个源域历史对象向量；所述目标域编码层针对所述M+1个目标域对象，基于所述M+1个源域对象确定目标域注意力，从而编码得到目标域当前对象向量和M个目标域历史对象向量；基于所述M个源域历史对象向量以及M个目标域历史对象向量，分别进行第一融合和第二融合，对应得到源域用户向量和目标域用户向量；基于所述源域用户向量和所述源域当前对象向量，确定源域行为预测结果；基于所述目标域用户向量和目标域当前对象向量，确定目标域行为预测结果；基于所述源域行为预测结果和源域行为标签，以及所述目标域行为预测结果和目标域行为标签，更新所述行为预测系统。2.根据权利要求1所述的方法，其中，所述源域编码层包括N个源域编码子层，其中第i个源域编码子层获取所述M+1个源域对象的上一层表征向量和所述M+1个目标域对象的上一层表征向量，至少基于对所述M+1个目标域对象的上一层表征向量的第一线性变换结果确定所述源域注意力，基于所述源域注意力编码得到所述M+1个源域对象的本层表征向量；所述目标域编码层包括N个目标域编码子层，其中第i个目标域编码子层获取所述M+1个源域对象的上一层表征向量和所述M+1个目标域对象的上一层表征向量，至少基于对所述M+1个源域对象的上一层表征向量的第二线性变换结果确定所述目标域注意力，基于所述目标域注意力编码得到所述M+1个目标域对象的本层表征向量。3.根据权利要求2所述的方法，其中，所述行为预测系统还包括，源域嵌入层和目标域嵌入层，所述源域嵌入层确定所述M+1个源域对象对应的M+1个源域对象嵌入向量；所述目标域嵌入层确定所述M+1个目标域对象对应的M+1个目标域对象嵌入向量；所述第i个为第1个；所述M+1个目标域对象的上一层表征向量为所述M+1个目标域对象嵌入向量；所述M+1个源域对象的上一层表征向量为所述M+1个源域对象嵌入向量。4.根据权利要求2所述的方法，其中，所述第i个不是第1个；所述M+1个目标域对象的上一层表征向量为，第i-1个目标域编码层输出的M+1个目标域对象表征向量；所述M+1个源域对象的上一层表征向量为，第i-1个源域编码层输出的M+1个源域对象表征向量。5.根据权利要求2所述的方法，其中，所述源域编码层和目标域编码层均基于Transformer机制；所述第i个源域编码子层，利用源域查询变换矩阵对所述M+1个目标域对象的上一层表征向量进行所述第一线性变换，得到源域查询结果矩阵；分别利用源域键变换矩阵和源域值变换矩阵对所述M+1个源域对象的上一层表征向量进行变换，得到对应的源域键结果矩
阵和源域值结果矩阵；基于所述源域查询结果矩阵和所述源域键结果矩阵的乘积确定所述源域注意力，基于所述源域注意力和所述源域值结果矩阵，得到所述M+1个源域对象的本层表征向量；所述第i个目标域编码子层，利用目标域查询变换矩阵对所述M+1个源域对象的上一层表征向量进行所述第二线性变换，得到目标域查询结果矩阵；分别利用目标域键变换矩阵和目标域值变换矩阵对所述M+1个目标域对象的上一层表征向量进行变换，得到对应的目标域键结果矩阵和目标域值结果矩阵；基于所述目标域查询结果矩阵和所述目标域键结果矩阵的乘积确定所述目标域注意力，基于所述目标域注意力和所述目标域值结果矩阵，得到所述M+1个目标域对象的本层表征向量。6.根据权利要求2所述的方法，其中，所述源域编码层和目标域编码层均基于Transformer机制；所述第i个源域编码子层，分别利用源域键变换矩阵和源域值变换矩阵对所述M+1个目标域对象的上一层表征向量进行所述第一线性变换，得到源域键结果矩阵和源域值结果矩阵；利用源域查询变换矩阵对所述M+1个源域对象的上一层表征向量进行变换，得到源域查询结果矩阵；基于所述源域查询结果矩阵和所述源域键结果矩阵的乘积确定所述源域注意力，基于所述源域注意力和所述源域值结果矩阵，得到所述M+1个源域对象的本层表征向量；所述第i个目标域编码子层，分别利用目标域键变换矩阵和目标域值变换矩阵对所述M+1个源域对象的上一层表征向量进行所述第二线性变换，得到目标域键结果矩阵和目标域值结果矩阵；利用目标域查询变换矩阵对所述M+1个目标域对象的上一层表征向量进行变换，得到目标域查询结果矩阵；基于所述目标域查询结果矩阵和所述目标域键结果矩阵的乘积确定所述目标域注意力，基于所述目标域注意力和所述目标域值结果矩阵，得到所述M+1个目标域对象的本层表征向量。7.根据权利要求1所述的方法，其中，所述第一融合包括：利用第一组合权重，对所述M个源域历史对象向量的源域平均向量，以及所述M个目标域历史对象向量的目标域平均向量进行加权求和，得到所述源域用户向量；所述第二融合包括：利用第二组合权重，对所述源域平均向量和目标域平均向量进行加权求和，得到...

【专利技术属性】
技术研发人员：董鑫，高喆，莫林剑，李宁，李海，程磊，何勇，严坦，
申请(专利权)人：蚂蚁智信杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人