一种物料召回方法、装置、设备及存储介质制造方法及图纸

技术编号:25346162 阅读:30 留言:0更新日期:2020-08-21 17:05
本申请公开了一种物料召回方法、装置、设备及存储介质,涉及信息召回技术领域。具体实现方案为:获取用户特征的用户特征向量,以及多个物料的物料特征向量,其中,所述用户特征向量和物料特征向量是通过同一模型获取的;计算所述用户特征向量与所述物料特征向量的距离;依据所述距离,召回N个物料,其中,所述N个物料为所述多个物料中按照所述距离从小到大的排序中的前N个物料,N为大于或者等于1的整数。本申请可以简化物料召回过程。

【技术实现步骤摘要】
一种物料召回方法、装置、设备及存储介质
本申请涉及计算机
中的信息召回
,尤其涉及一种物料召回方法、装置、设备及存储介质。
技术介绍
目前主流的推荐系统通常包括召回阶段和排序阶段,其中,召回阶段主要是通过多路召回方式召回物料,例如:通过基于用户兴趣召回、基于协同过滤召回、基于地域召回等等。由于通过需要通过多路召回,且多路之间召回的物料打分不可比较,需要对多路召回的物料进行统一打分并排序,才可以召回物料,这样导致物料召回过程比较复杂。
技术实现思路
本申请提供了一种物料召回方法、装置、设备及存储介质,以解决物料召回过程比较复杂的问题。根据第一方面,提供了一种物料召回方法,包括:获取用户特征的用户特征向量,以及多个物料的物料特征向量,其中,所述用户特征向量和物料特征向量是通过同一模型获取的;计算所述用户特征向量与所述物料特征向量的距离;依据所述距离,召回N个物料,其中,所述N个物料为所述多个物料中按照所述距离从小到大的排序中的前N个物料,N为大于或者等于1的整数。根据第二方面,提供了物料召回装置,包括:获取模块,用于获取用户特征的用户特征向量,以及多个物料的物料特征向量,其中,所述用户特征向量和物料特征向量是通过同一模型获取的;计算模块,用于计算所述用户特征向量与所述物料特征向量的距离;召回模块,用于依据所述距离,召回N个物料,其中,所述N个物料为所述多个物料中按照所述距离从小到大的排序中的前N个物料,N为大于或者等于1的整数。根据第三方面,提供了一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请提供的物料召回方法。根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行申请提供的物料召回方法。根据本申请的技术方案,可以通过一个模型获取用户特征向量和物料特征向量,直接依据距离进行排序,以实现最终N个物料的召回,以简化物料召回过程。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请提供的本申请提供的一种物料召回方法的流程图;图2是本申请提供的一种双塔模型的示意图;图3是本申请提供的一种物料召回的示意图;图4是本申请提供的本申请提供一种物料召回装置的结构图;图5是本申请提供的本申请提供一种物料召回装置的结构图;图6是用来实现本申请实施例的多媒体内容检索方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。请参见图1,图1是本申请提供的一种物料召回方法的流程图,如图1所示,包括以下步骤:步骤S101、获取用户特征的用户特征向量,以及多个物料的物料特征向量,其中,所述用户特征向量和物料特征向量是通过同一模型获取的。其中,上述用户特征可以是被推荐物料的用户的相关特征,例如:属性、行为数据或者偏好等特征。而上述用户特征的用户特征向量可以是,用于表示用户特征的全部特征的向量,或者可以是上述用户特征中的具有代表性特征的向量。上述多个物料可以是物料库中的所有或者部分物料,且这些物料可以包括文本、图片、视频和链接等多媒体内容中的至少一项。而上述物料特征向量可以是每个物料对应一个或者多个特征向量,具体可以是用于表示物料的物料特征的全部特征的向量,或者可以是上述物料特征中的具有代表性特征的向量。且上述多个物料可以包括多个类别的物料。另外,本申请中物料可以是小程序的图片、文字等素材,也可以称作小程序的小程序信息。进一步的,本申请中对步骤S101获取用户特征向量和物料特征向量的时间顺序不作限定,例如:可以是先后获取,或者同时获取用户特征向量和物料特征向量。另外,上述模型可以是预先训练或者预先配置的能够识别用户特征向量和物料特征向量的网络模型。步骤S102、计算所述用户特征向量与所述物料特征向量的距离。上述计算所述用户特征向量与所述物料特征向量的距离可以是,通过用于计算向量距离的公式或者函数来计算,例如:通过cosine函数计向量的距离。另外,上述用户特征向量与所述物料特征向量的距离可以表示用户特征向量与物料特征向量的相似度,即上述距离也可以称作相似度得分。步骤S103、依据所述距离,召回N个物料,其中,所述N个物料为所述多个物料中按照所述距离从小到大的排序中的前N个物料,N为大于或者等于1的整数。上述N可以是预先配置好的整数,或者在执行步骤S103时根据实际需求确定的整数。另外,上述召回物料可以是通过向量索引召回上述N个物料。本申请中,通过上述步骤可以通过一个模型获取用户特征向量和物料特征向量,直接依据距离进行排序,以实现最终N个物料的召回,以简化物料召回过程。另外,由于可以通过用户特征向量和物料特征向量快速召回N个物料,且由于通过同一模型获取用户特征向量和物料特征向量,这样可以降低物料召回的复杂度,且能够快速实现模型的调优,使召回策略能快速的更新迭代。需要说明的是,上述物料召回方法可以应用于电子设备,如服务器、计算机、手机等电子设备。作为一种可选的实施方式,上述模型为双塔模型,且所述计算所述用户特征向量与所述物料特征向量的距离,包括:通过所述双塔模型计算所述用户特征向量与所述物料特征向量的距离。其中,上述双塔模型包括三部分,第一部分用于识别用户特征的用户特征向量,第二部分用于识别物料的物料特征向量,第三部分计算所述用户特征向量与所述物料特征向量的距离。例如:如图2所示,201表示部分用于识别用户特征的用户特征向量,202表示部分用于识别物料的物料特征向量,203表示部分用于计算所述用户特征向量与所述物料特征向量的距离。其中,201包括嵌入层(Embedding)、池化层(pooling)和全连接层(FC),其中,该全连接层的输出为用户特征向量;202同样可以包括嵌入层(Embedding)、池化层(pooling)和全连接层(FC),其中,该全连接层的输出为物料特征向量;而203可以包括用于计算向量距离的公式或者函数,如cosine函数。另外,上述双塔模型可以是通过包括用户特征数据和物料特征数据的用户行为数据为样本进行训练得到。例如:本文档来自技高网...

【技术保护点】
1.一种物料召回方法,其特征在于,包括:/n获取用户特征的用户特征向量,以及多个物料的物料特征向量,其中,所述用户特征向量和物料特征向量是通过同一模型获取的;/n计算所述用户特征向量与所述物料特征向量的距离;/n依据所述距离,召回N个物料,其中,所述N个物料为所述多个物料中按照所述距离从小到大的排序中的前N个物料,N为大于或者等于1的整数。/n

【技术特征摘要】
1.一种物料召回方法,其特征在于,包括:
获取用户特征的用户特征向量,以及多个物料的物料特征向量,其中,所述用户特征向量和物料特征向量是通过同一模型获取的;
计算所述用户特征向量与所述物料特征向量的距离;
依据所述距离,召回N个物料,其中,所述N个物料为所述多个物料中按照所述距离从小到大的排序中的前N个物料,N为大于或者等于1的整数。


2.如权利要求1所述的方法,其特征在于,所述模型为双塔模型,且所述计算所述用户特征向量与所述物料特征向量的距离,包括:
通过所述双塔模型计算所述用户特征向量与所述物料特征向量的距离。


3.如权利要求1所述的方法,其特征在于,所述用户特征包括如下至少一项:
用户画像数据、用户的行为数据和第一召回特征;
其中,所述用户的行为数据包括点击率CTR信号,所述第一召回特征包括用户针对于至少一个物料类别的召回信息;
和/或,
所述物料特征向量为物料特征的向量,且所述物料特征包括如下至少一项:
物料的属性、物料作者的相关特征、物料的统计特征和第二召回特征;
其中,所述统计特征包括CTR信号,所述第二召回特征包括至少一个物料类别的召回信息。


4.如权利要求1所述的方法,其特征在于,所述获取用户特征的用户特征向量,以及多个物料的物料特征向量,包括:
通过所述模型离线计算用户特征的用户特征向量,以及通过所述模型在线计算多个物料的物料特征向量。


5.如权利要求1至4中任一项所述的方法,其特征在于,所述依据所述距离,获取N个物料之后,所述方法包括:
将所述N个物料与用户的类别偏好进行显示校验,去除所述N个物料与所述类别偏好不匹配的物料。


6.一种物料召回装置,其特征在于,包括:
获取模块,用于获取用户特征的用户特征向量,以及多个物料的物料特征向量,其中,所述用户特征向量和物料特征向量是通过同一模型获取的...

【专利技术属性】
技术研发人员:隆秀芸李会鹏刘丽红刘佳卉杨宏生卢玉奇
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1