召回模型训练方法及推荐方法、装置、电子设备制造方法及图纸

技术编号：37995467 阅读：9 留言：0更新日期：2023-06-30 10:09

本发明专利技术实施例提供的召回模型训练方法及推荐方法、装置、电子设备，应用于信息技术领域，通过获取至少一个搜索词样本和每个搜索词样本对应的多个第一召回结果的特征相似度；获取第一预设历史时间范围内针对各第一召回结果的第一选取信息，并根据第一选取信息从多个第一召回结果中选取一个或多个作为第一负样本；将至少一个搜索词样本和一个或多个第一负样本输入待训练的召回模型计算得到对应计算结果，根据该计算结果进行训练，直至达到预设迭代停止条件或当前损失小于预设损失阈值，得到训练好的召回模型，从而在选取训练样本的过程中可以无需人工就可以进行训练样本的选取，提高训练样本的选取效率，从而提高模型的训练效率。效率。效率。

全部详细技术资料下载

【技术实现步骤摘要】
召回模型训练方法及推荐方法、装置、电子设备

[0001]本专利技术涉及信息
，特别是涉及召回模型训练方法及推荐方法、装置、电子设备。

技术介绍

[0002]目前，在用户使用部分应用过程中，往往会根据用户请求进行信息的召回和推荐。例如，在用户检索某一主题类型的视频时，可以通过召回模型根据该主题进行相关信息的召回，然后再从召回的信息中选取全部或部分信息向用户进行推荐。
[0003]然而，在进行召回模型的训练过程中，往往需要大量的训练样本进行模型的训练。而目前往往是通过人工进行训练样本的选取，通过该方法不但训练样本的选取效率较低，而且往往还会影响模型训练的效率。

技术实现思路

[0004]本专利技术实施例的目的在于提供召回模型训练方法及推荐方法、装置、电子设备，以实现提高召回模型的训练效率。具体技术方案如下：
[0005]在本专利技术实施的第一方面，首先提供了一种召回模型训练方法，所述方法包括：
[0006]获取至少一个搜索词样本和每个搜索词样本对应的多个第一召回结果的特征相似度，其中，每个第一召回结果对应一个特征相似度，所述特征相似度表示该第一召回结果和所述至少一个搜索词样本的相似度；
[0007]获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息，并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本；
[0008]将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型，并根据该待训练的召回模型计算得到对应计算...

【技术保护点】

【技术特征摘要】
1.一种召回模型训练方法，其特征在于，所述方法包括：获取至少一个搜索词样本和每个搜索词样本对应的多个第一召回结果的特征相似度，其中，每个第一召回结果对应一个特征相似度，所述特征相似度表示该第一召回结果和所述至少一个搜索词样本的相似度；获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息，并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本；将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型，并根据该待训练的召回模型计算得到对应计算结果，根据该计算结果计算所述待训练的召回模型当前的损失，根据所述当前损失对所述待训练的召回模型的参数进行调整，返回所述将所述至少一个搜索词样本和所述一个或多个第一负样本输入待训练的召回模型的步骤继续进行训练，直至达到预设迭代停止条件或当前损失小于预设损失阈值，得到训练好的召回模型。2.根据权利要求1所述的方法，其特征在于，所述获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息，并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本，包括：识别所述多个第一召回结果中对应的特征相似度不在第一预设范围内的第一召回结果，得到一个或多个第二召回结果；获取第一预设历史时间范围内针对各所述第一召回结果的第一选取信息，并根据所述第一选取信息从所述一个或多个第二召回结果中选取一个或多个作为第一负样本。3.根据权利要求1所述的方法，其特征在于，所述获取第一预设历史时间范围内针对各所述第一召回结果的选取信息，并根据所述第一选取信息从所述多个第一召回结果中选取一个或多个作为第一负样本，包括：获取第一预设历史时间范围内针对各所述第一召回结果的选取信息，其中，各所述第一召回结果的选取信息表示各所述第一召回结果中用户选取过的召回结果的信息；根据所述第一选取信息，按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本。4.根据权利要求1所述的方法，其特征在于，所述第一选取信息包括多个预设时间范围各自对应的第二选取信息，所述根据所述选取信息，按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本，包括：获取所述多个预设时间范围各自对应的选取概率，其中，所述多个预设时间范围各自对应的选取概率中越靠近当前时刻的预设时间范围对应的选取概率越高；根据所述多个预设时间范围各自对应的第二选取信息和所述多个预设时间范围各自对应的选取概率，从所述多个第一召回结果中选取一个或多个作为第一负样本。5.根据权利要求3所述的方法，其特征在于，所述根据所述第一选取信息，按照第一预设概率从所述多个第一召回结果中选取一个或多个作为第一负样本，包括：识别所述多个第一召回结果中，除所述第一负样本之外的召回结果，得到第三召回结果；识别所述第三召回结...

【专利技术属性】
技术研发人员：潘迪生，
申请(专利权)人：北京爱奇艺科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人