对象召回模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24888958 阅读:14 留言:0更新日期:2020-07-14 18:16
本公开的实施例提供了一种对象召回模型训练方法、装置、电子设备及存储介质。所述方法包括:获取预设数量的预置类型的会话数据;根据每条所述会话数据中的业务对象的排列顺序,获取每条所述会话数据中的前n个业务对象和后n个业务对象;所述n为大于预设数值的正整数;获取所述前n个业务对象和所述后n个业务对象中每个业务对象的顺序属性、位置属性和种类属性;基于所述顺序属性、所述位置属性和所述种类属性,训练初始相似对象召回模型;在预设数量的会话数据均训练完成之后,将训练后的初始相似对象召回模型作为最终的相似对象召回模型。本公开的实施例可以使召回的候选poi品类更相近、地理位置更接近,进而,可以提高线上DAU指标。

【技术实现步骤摘要】
对象召回模型训练方法、装置、电子设备及存储介质
本公开的实施例涉及模型训练
,尤其涉及一种对象召回模型训练方法、装置、电子设备及存储介质。
技术介绍
在推荐、广告算法领域,通常由召回+排序两大核心模块组成,“召回”指从海量信息集合中触发尽可能多正确的结果,召回策略有很多种,其中一种是“item2item”策略,即根据给定的某个item(比如poi(PointofInterest,兴趣点)等)返回与其相似的N个item。“item2item”策略中常见的方法是基于物品的协同过滤法,该方法认为物品A和物品B具有很大的相似度是因为喜欢物品A的用户大都也喜欢物品B。具体到我们的业务场景中来说,选用不同用户在美团App内session(30分钟内的行为)中的poi数据,构成用户按时间顺序点击过的poi序列,对每条session内的任意2个poi都可以构成poi对,认为其互为相似,进而可以构成poi的相似度矩阵,形成相似度矩阵的示意过程如图1所示。对于上面形成的相似度矩阵,可以使用余弦相似度方法计算poi-i与poi-j的相似度。对于每一个poi,选取其相似度最高的前20个poi形成相似poi列表,形成Key-Value(键值对)格式的词表文件,线上使用查找词表的方式即可确定指定poi的多个相似poi。上述方案中,忽略了session内部的顺序,且忽略了用户在同一session内点击poi所处位置和所属品类的变化。
技术实现思路
本公开的实施例提供一种对象召回模型训练方法、装置、电子设备及存储介质,用以基于session内部的顺序、用户在同一session内点击poi所处位置和所属品类训练召回模型,可以使召回的候选poi品类更相近、地理位置更接近,进而,可以提高线上DAU(DailyActiveUser,日活跃用户数量)指标。根据本公开的实施例的第一方面,提供了一种对象召回模型训练方法,包括:获取预设数量的预置类型的会话数据;根据每条所述会话数据中的业务对象的排列顺序,获取每条所述会话数据中的前n个业务对象和后n个业务对象;所述n为大于预设数值的正整数;获取所述前n个业务对象和所述后n个业务对象中每个业务对象的顺序属性、位置属性和种类属性;基于所述顺序属性、所述位置属性和所述种类属性,训练初始相似对象召回模型;在预设数量的会话数据均训练完成之后,将训练后的初始相似对象召回模型作为最终的相似对象召回模型。可选地,所述获取预设数量的点击类型的会话数据,包括:获取多个预置类型的会话数据;从所述多个预置类型的会话数据中,筛选出符合条件的预设数量的会话数据。可选地,所述获取所述前n个业务对象和所述后n个业务对象中每个业务对象的顺序属性、位置属性和种类属性,包括:根据每条所述会话数据中的业务对象的排列顺序,确定所述前n个业务对象中每个业务对象的第一顺序属性,及所述后n个业务对象中每个业务对象的第二顺序属性;根据每条会话数据中的业务对象所处的位置,确定所述前n个业务对象中每个业务对象的第一位置属性,及所述后n个业务对象中每个业务对象的第二位置属性;根据每条会话数据中的业务对象的类型信息,确定所述前n个业务对象中每个业务对象的第一种类属性,及所述后n个业务对象中每个业务对象的第二种类属性。可选地,所述初始相似对象召回模型包括输入层、输出层和抽样归一化指数函数层,所述基于所述顺序属性、所述位置属性和所述种类属性,训练初始相似对象召回模型,包括:将所述第一顺序属性、所述第一位置属性和所述第一种类属性输入至所述输入层;将所述第二顺序属性、所述第二位置属性和所述第二种类属性输入至所述输出层;基于所述输入层根据所述第一顺序属性、所述第一位置属性和所述第一种类属性,确定所述前n个业务对象中每个业务对象对应的第一合成向量;基于所述根据所述第二顺序属性、所述第二位置属性和所述第二种类属性,确定所述后n个业务对象中每个业务对象对应的第二合成向量;调用所述抽样归一化指数函数层,根据所述第一合成向量和所述第二合成向量,确定所述前n个业务对象中每个业务对象对应的相似对象结果。可选地,所述输入层包括:第一顺序向量嵌入层、第一种类向量嵌入层和第一位置向量嵌入层,所述基于所述输入层根据所述第一顺序属性、所述第一位置属性和所述第一种类属性,确定所述前n个业务对象中每个业务对象对应的第一合成向量,包括:基于所述第一顺序向量嵌入层,确定所述第一顺序属性对应的第一顺序向量;基于所述第一位置向量嵌入层,确定所述第一位置属性对应的第一位置向量;基于所述第一种类向量嵌入层,确定所述第一种类属性对应的第一种类向量;根据所述第一顺序向量、所述第一位置向量和所述第一种类向量,确定所述第一合成向量。可选地,所述输出层包括:第二顺序向量嵌入层、第二种类向量嵌入层和第二位置向量嵌入层,所述基于所述根据所述第二顺序属性、所述第二位置属性和所述第二种类属性,确定所述后n个业务对象中每个业务对象对应的第二合成向量,包括:基于所述第二顺序向量嵌入层,确定所述第二顺序属性对应的第二顺序向量;基于所述第二位置向量嵌入层,确定所述第二位置属性对应的第二位置向量;基于所述第二种类向量嵌入层,确定所述第二种类属性对应的第二种类向量;根据所述第二顺序向量、所述第二位置向量和所述第二种类向量,确定所述第二合成向量。根据本公开的实施例的第二方面,提供了一种对象召回模型训练装置,包括:会话数据获取模块,用于获取预设数量的预置类型的会话数据;业务对象获取模块,用于根据每条所述会话数据中的业务对象的排列顺序,获取每条所述会话数据中的前n个业务对象和后n个业务对象;所述n为大于预设数值的正整数;业务属性获取模块,用于获取所述前n个业务对象和所述后n个业务对象中每个业务对象的顺序属性、位置属性和种类属性;初始模型训练模块,用于基于所述顺序属性、所述位置属性和所述种类属性,训练初始相似对象召回模型;最终模型获取模块,用于在预设数量的会话数据均训练完成之后,将训练后的初始相似对象召回模型作为最终的相似对象召回模型。可选地,所述会话数据获取模块包括:会话数据获取单元,用于获取多个预置类型的会话数据;会话数据筛选单元,用于从所述多个预置类型的会话数据中,筛选出符合条件的预设数量的会话数据。可选地,所述业务属性获取模块包括:顺序属性确定单元,用于根据每条所述会话数据中的业务对象的排列顺序,确定所述前n个业务对象中每个业务对象的第一顺序属性,及所述后n个业务对象中每个业务对象的第二顺序属性;位置属性确定单元,用于根据每条会话数据中的业务对象所处的位置,确定所述前n个业务对象中每个业务对象的第一位置属性,及所述后n个业务对象中每个业务对象的第二位置属性;种类属性确定单元,用于本文档来自技高网...

【技术保护点】
1.一种对象召回模型训练方法,其特征在于,包括:/n获取预设数量的预置类型的会话数据;/n根据每条所述会话数据中的业务对象的排列顺序,获取每条所述会话数据中的前n个业务对象和后n个业务对象;所述n为大于预设数值的正整数;/n获取所述前n个业务对象和所述后n个业务对象中每个业务对象的顺序属性、位置属性和种类属性;/n基于所述顺序属性、所述位置属性和所述种类属性,训练初始相似对象召回模型;/n在预设数量的会话数据均训练完成之后,将训练后的初始相似对象召回模型作为最终的相似对象召回模型。/n

【技术特征摘要】
1.一种对象召回模型训练方法,其特征在于,包括:
获取预设数量的预置类型的会话数据;
根据每条所述会话数据中的业务对象的排列顺序,获取每条所述会话数据中的前n个业务对象和后n个业务对象;所述n为大于预设数值的正整数;
获取所述前n个业务对象和所述后n个业务对象中每个业务对象的顺序属性、位置属性和种类属性;
基于所述顺序属性、所述位置属性和所述种类属性,训练初始相似对象召回模型;
在预设数量的会话数据均训练完成之后,将训练后的初始相似对象召回模型作为最终的相似对象召回模型。


2.根据权利要求1所述的方法,其特征在于,所述获取预设数量的点击类型的会话数据,包括:
获取多个预置类型的会话数据;
从所述多个预置类型的会话数据中,筛选出符合条件的预设数量的会话数据。


3.根据权利要求1所述的方法,其特征在于,所述获取所述前n个业务对象和所述后n个业务对象中每个业务对象的顺序属性、位置属性和种类属性,包括:
根据每条所述会话数据中的业务对象的排列顺序,确定所述前n个业务对象中每个业务对象的第一顺序属性,及所述后n个业务对象中每个业务对象的第二顺序属性;
根据每条会话数据中的业务对象所处的位置,确定所述前n个业务对象中每个业务对象的第一位置属性,及所述后n个业务对象中每个业务对象的第二位置属性;
根据每条会话数据中的业务对象的类型信息,确定所述前n个业务对象中每个业务对象的第一种类属性,及所述后n个业务对象中每个业务对象的第二种类属性。


4.根据权利要求3所述的方法,其特征在于,所述初始相似对象召回模型包括输入层、输出层和抽样归一化指数函数层,
所述基于所述顺序属性、所述位置属性和所述种类属性,训练初始相似对象召回模型,包括:
将所述第一顺序属性、所述第一位置属性和所述第一种类属性输入至所述输入层;
将所述第二顺序属性、所述第二位置属性和所述第二种类属性输入至所述输出层;
基于所述输入层根据所述第一顺序属性、所述第一位置属性和所述第一种类属性,确定所述前n个业务对象中每个业务对象对应的第一合成向量;
基于所述根据所述第二顺序属性、所述第二位置属性和所述第二种类属性,确定所述后n个业务对象中每个业务对象对应的第二合成向量;
调用所述抽样归一化指数函数层,根据所述第一合成向量和所述第二合成向量,确定所述前n个业务对象中每个业务对象对应的相似对象结果。


5.根据权利要求4所述的方法,其特征在于,所述输入层包括:第一顺序向量嵌入层、第一种类向量嵌入层和第一位置向量嵌入层,
所述基于所述输入层根据所述第一顺序属性、所述第一位置属性和所述第一种类属性,确定所述前n个业务对象中每个业务对象对应的第一合成向量,包括:
基于所述第一顺序向量嵌入层,确定所述第一顺序属性对应的第一顺序向量;
基于所述第一位置向量嵌入层,确定所述第一位置属性对应的第一位置向量;
基于所述第一种类向量嵌入层,确定所述第一种类属性对应的第一种类向量;
根据所述第一顺序向量、所述第一位置向量和所述第一种类向量,确定所述第一合成向量。


6.根据权利要求4所述的方法,其特征在于,所述输出层包括:第二顺序向量嵌入层、第二种类向量嵌入层和第二位置向量嵌入层,
所述基于所述根据所述第二顺序属性、所述第二位置属性和所述第二种类属性,确定所述后n个业务对象中每个业务对象对应的第二合成向量,包括:
基于所述第二顺序向量嵌入层,确定所述第二顺序属性对应的第二顺序向量;
基于所述第二位置向量嵌入层,确定所述第二位置属性对应的第二位置向量;
基于所述第二种类向量嵌入层,确定所述第二种类属性对应的第二种类向量;
根据所述第二顺序向量、所述第二位置向量和所述第二种类向量,确定所述第二合成向量。


7.一种对象召回模型训练装置,其特征在于,包括:
会话数据获取模块,用于获取预设数量的预置类型的会话数据;
业务对象获取模块,用于根据每条所述会话数据中的业务对象的排列顺序,获取每条所述会话数据中的前n个业务对象和后n个业务对象;所述n为大于预设数值的正整数;
业务属性获取模块,用于获...

【专利技术属性】
技术研发人员:刘永刚李乐
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1