【技术实现步骤摘要】
一种召回模型的训练及检索方法、装置及电子设备
[0001]本申请涉及搜索
,具体涉及一种召回模型的训练方法、装置、电子设备及存储介质。本申请同时还涉及一种搜索召回方法、装置、电子设备及存储介质。本申请同时还涉及一种检索方法、装置、电子设备及存储介质。
技术介绍
[0002]随着越来越多的人利用网络进行搜索,一些提供搜索功能的综合性平台往往提供多种行业产品和/或信息并且对接来自多端的搜索请求,使得搜索需求越来越多元化,这对搜索的精准度提出了更高的要求。搜索召回是搜索的基础,根据用户输入的搜索词从海量数据中召回与搜索词相关的信息,搜索召回的深度与质量是决定搜索精准度的关键因素,因此,如何保证搜索召回的深度与质量尤其重要。
[0003]现有技术中,可以通过关键词匹配、知识/标签匹配进行搜索召回,也可以通过机器学习模型确定搜索词和候选信息的相似度进行搜索召回。然而,实际上搜索需求的多元化使得现有搜索召回深度与质量难以保证,尤其是,一些搜索场景下的搜索召回的召回候选集受到制约因素(如时空属性的制约)的强制约,在该类搜索场 ...
【技术保护点】
【技术特征摘要】
1.一种召回模型的训练方法,其特征在于,包括:将训练样本的搜索侧信息作为待训练的召回模型的第一输入信息,输入所述召回模型的第一子网络得到第一输出信息,根据所述第一输出信息确定所述训练样本的搜索词特征;将训练样本的对象侧信息作为所述召回模型的第二输入信息,输入所述召回模型的第二子网络得到第二输出信息,根据所述第二输出信息确定所述训练样本的召回对象特征;基于第一损失函数训练所述召回模型,训练后得到目标召回模型;其中,所述第一损失函数,基于训练样本的搜索词特征与对应的召回对象特征之间的相似度构建,用于作为训练所述召回模型的目标函数。2.根据权利要求1所述的方法,其特征在于,还包括:获取训练样本的搜索词的邻居信息,根据所述邻居信息获取所述搜索词的搜索词邻居特征;基于所述搜索词邻居特征和所述第一输出信息确定所述搜索词与所述邻居信息相关的图注意力特征;根据所述图注意力特征与所述搜索词特征确定第二损失函数,将所述第二损失函数用于训练所述召回模型。3.根据权利要求2所述的方法,其特征在于,所述召回模型还包括第三子网络,所述第三子网络为搜索侧用于根据训练样本的搜索词的邻居信息获取搜索词邻居特征的子网络;所述根据所述邻居信息获取所述搜索词的搜索词邻居特征,包括:将所述邻居信息输入所述第三子网络,得到所述搜索词邻居特征。4.根据权利要求3所述的方法,其特征在于,所述第三子网络与所述第一子网络具有相同的网络结构和/或共享参数。5.根据权利要求2所述的方法,其特征在于,所述基于第一损失函数训练所述召回模型,包括:将所述第一损失函数以及所述第二损失函数作为用于训练所述召回模型的目标函数,训练所述召回模型。6.根据权利要求2所述的方法,其特征在于,所述获取训练样本的搜索词的邻居信息,包括:获取搜索日志,根据所述搜索日志生成用于表征搜索词与该搜索词的召回对象之间的点击关系图,所述点击关系图的各节点为对应于搜索词信息的搜索词节点,以及对应于各搜索词的发生了用户点击的点击对象节...
【专利技术属性】
技术研发人员:彭振,
申请(专利权)人:拉扎斯网络科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。