召回模型训练方法及推荐方法、装置、电子设备制造方法及图纸

技术编号:37995467 阅读:9 留言:0更新日期:2023-06-30 10:09
本发明专利技术实施例提供的召回模型训练方法及推荐方法、装置、电子设备,应用于信息技术领域,通过获取至少一个搜索词样本和每个搜索词样本对应的多个第一召回结果的特征相似度;获取第一预设历史时间范围内针对各第一召回结果的第一选取信息,并根据第一选取信息从多个第一召回结果中选取一个或多个作为第一负样本;将至少一个搜索词样本和一个或多个第一负样本输入待训练的召回模型计算得到对应计算结果,根据该计算结果进行训练,直至达到预设迭代停止条件或当前损失小于预设损失阈值,得到训练好的召回模型,从而在选取训练样本的过程中可以无需人工就可以进行训练样本的选取,提高训练样本的选取效率,从而提高模型的训练效率。效率。效率。

【技术实现步骤摘要】
召回模型训练方法及推荐方法、装置、电子设备


[0001]本专利技术涉及信息
,特别是涉及召回模型训练方法及推荐方法、装置、电子设备。

技术介绍

[0002]目前,在用户使用部分应用过程中,往往会根据用户请求进行信息的召回和推荐。例如,在用户检索某一主题类型的视频时,可以通过召回模型根据该主题进行相关信息的召回,然后再从召回的信息中选取全部或部分信息向用户进行推荐。
[0003]然而,在进行召回模型的训练过程中,往往需要大量的训练样本进行模型的训练。而目前往往是通过人工进行训练样本的选取,通过该方法不但训练样本的选取效率较低,而且往往还会影响模型训练的效率。

技术实现思路

[0004]本专利技术实施例的目的在于提供召回模型训练方法及推荐方法、装置、电子设备,以实现提高召回模型的训练效率。具体技术方案如下:
[0005]在本专利技术实施的第一方面,首先提供了一种召回模型训练方法,所述方法包括:
[0006]获取至少一个搜索词样本和每个搜索词样本对应的多个第一召回结果的特征相似度,其中,每个第一召回结果对应一个特征相似度,所述特征相似度表示该第一召回结果和所述至少一个搜索词样本的相似度;
[0007]获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本;
[0008]将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型,并根据该待训练的召回模型计算得到对应计算结果,根据该计算结果计算所述待训练的召回模型当前的损失,根据所述当前损失对所述待训练的召回模型的参数进行调整,返回所述将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型的步骤继续进行训练,直至达到预设迭代停止条件或当前损失小于预设损失阈值,得到训练好的召回模型。
[0009]在一种可能的实施方式中,所述获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本,包括:
[0010]识别所述多个第一召回结果中对应的特征相似度不在第一预设范围内的第一召回结果,得到一个或多个第二召回结果;
[0011]获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述一个或多个第二召回结果中选取一个或多个作为第一负样本。
[0012]在一种可能的实施方式中,所述获取第一预设历史时间范围内针对各所述第一召回结果的选取信息,并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个
作为第一负样本,包括:
[0013]获取第一预设历史时间范围内针对各所述第一召回结果的选取信息,其中,各所述第一召回结果的选取信息表示各所述第一召回结果中用户选取过的召回结果的信息;
[0014]根据所述第一选取信息,按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本。
[0015]在一种可能的实施方式中,所述第一选取信息包括多个预设时间范围各自对应的第二选取信息,所述根据所述选取信息,按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本,包括:
[0016]获取所述多个预设时间范围各自对应的选取概率,其中,所述多个预设时间范围各自对应的选取概率中越靠近当前时刻的预设时间范围对应的选取概率越高;
[0017]根据所述多个预设时间范围各自对应的第二选取信息和所述多个预设时间范围各自对应的选取概率,从所述多个第一召回结果中选取一个或多个作为第一负样本。
[0018]在一种可能的实施方式中,所述根据所述第一选取信息,按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本,包括:
[0019]识别所述多个第一召回结果中,除所述第一负样本之外的召回结果,得到第三召回结果;
[0020]识别所述第三召回结果中的预设的目标类型的召回结果,并按照第二预设概率从识别到的召回结果中选取一个或多个作为所述第一负样本,其中,所述第二预设概率大于所述第一预设概率。
[0021]在本专利技术实施的第二方面,还提供了一种推荐方法,所述方法包括:
[0022]获取待搜索的搜索词;
[0023]将所述搜索词输入预先训练好的召回模型中,以使所述预先训练好的召回模型识别与所述搜索词匹配的一个或多个召回结果和每个召回结果对应的匹配度,其中,所述预先训练好的召回模型是通过上述任一所述的召回模型训练方法训练得到的网络模型;
[0024]通过每个召回结果对应的匹配度,对所述一个或多个召回结果按照从大到小的顺序进行排序,并选取前N个进行反馈。
[0025]在本专利技术实施的第三方面,还提供了一种召回模型训练装置,所述装置包括:
[0026]相似度获取模块,用于获取至少一个搜索词样本和每个搜索词样本对应的多个第一召回结果的特征相似度,其中,每个第一召回结果对应一个特征相似度,所述特征相似度表示该第一召回结果和所述至少一个搜索词样本的相似度;
[0027]样本选取模块,用于获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本;
[0028]模型训练模块,用于将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型,并根据该待训练的召回模型计算得到对应计算结果,根据该计算结果计算所述待训练的召回模型当前的损失,根据所述当前损失对所述待训练的召回模型的参数进行调整,返回所述将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型的步骤继续进行训练,直至达到预设迭代停止条件或当前损失小于预设损失阈值,得到训练好的召回模型。
[0029]在一种可能的实施方式中,所述样本选取模块,包括:
[0030]召回结果识别子模块,用于识别所述多个第一召回结果中对应的特征相似度不在第一预设范围内的第一召回结果,得到一个或多个第二召回结果;
[0031]第一负样本获取子模块,用于获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述一个或多个第二召回结果中选取一个或多个作为第一负样本。
[0032]在一种可能的实施方式中,所述样本选取模块,包括:
[0033]选取信息获取子模块,用于获取第一预设历史时间范围内针对各所述第一召回结果的选取信息,其中,各所述第一召回结果的选取信息表示各所述第一召回结果中用户选取过的召回结果的信息;
[0034]第一负样本选取子模块,用于根据所述第一选取信息,按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本。
[0035]在一种可能的实施方式中,所述第一负样本选取子模块,包括:
[0036]选取概率获取单元,用于获取所述多个预设时间范围各自对应的选取概率,其中,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种召回模型训练方法,其特征在于,所述方法包括:获取至少一个搜索词样本和每个搜索词样本对应的多个第一召回结果的特征相似度,其中,每个第一召回结果对应一个特征相似度,所述特征相似度表示该第一召回结果和所述至少一个搜索词样本的相似度;获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本;将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型,并根据该待训练的召回模型计算得到对应计算结果,根据该计算结果计算所述待训练的召回模型当前的损失,根据所述当前损失对所述待训练的召回模型的参数进行调整,返回所述将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型的步骤继续进行训练,直至达到预设迭代停止条件或当前损失小于预设损失阈值,得到训练好的召回模型。2.根据权利要求1所述的方法,其特征在于,所述获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本,包括:识别所述多个第一召回结果中对应的特征相似度不在第一预设范围内的第一召回结果,得到一个或多个第二召回结果;获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息,并根据所述第一选取信息从所述一个或多个第二召回结果中选取一个或多个作为第一负样本。3.根据权利要求1所述的方法,其特征在于,所述获取第一预设历史时间范围内针对各所述第一召回结果的选取信息,并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本,包括:获取第一预设历史时间范围内针对各所述第一召回结果的选取信息,其中,各所述第一召回结果的选取信息表示各所述第一召回结果中用户选取过的召回结果的信息;根据所述第一选取信息,按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本。4.根据权利要求1所述的方法,其特征在于,所述第一选取信息包括多个预设时间范围各自对应的第二选取信息,所述根据所述选取信息,按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本,包括:获取所述多个预设时间范围各自对应的选取概率,其中,所述多个预设时间范围各自对应的选取概率中越靠近当前时刻的预设时间范围对应的选取概率越高;根据所述多个预设时间范围各自对应的第二选取信息和所述多个预设时间范围各自对应的选取概率,从所述多个第一召回结果中选取一个或多个作为第一负样本。5.根据权利要求3所述的方法,其特征在于,所述根据所述第一选取信息,按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本,包括:识别所述多个第一召回结果中,除所述第一负样本之外的召回结果,得到第三召回结果;识别所述第三召回结...

【专利技术属性】
技术研发人员:潘迪生
申请(专利权)人:北京爱奇艺科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1