一种内容召回方法、装置、服务器及存储介质制造方法及图纸

技术编号:34443676 阅读:19 留言:0更新日期:2022-08-06 16:36
本公开提供一种内容召回方法、装置、服务器及存储介质。该方法包括:获得候选推荐内容,所述候选推荐内容包括已曝光内容;对所述已曝光内容进行特征提取,获得消费行为特征,所述消费行为特征用于表示所述已曝光内容对应的消费行为;通过已训练的召回模型,根据所述消费行为特征,从所述已曝光内容中确定待推荐内容,其中,所述召回模型至少是基于预设时间段内的曝光未消费内容的频次确定的。在本公开中,通过采用至少基于预设时间段内的曝光未消费内容的频次确定的召回模型进行内容召回,能够提升召回的内容质量,提高召回率和精确率。提高召回率和精确率。提高召回率和精确率。

【技术实现步骤摘要】
一种内容召回方法、装置、服务器及存储介质


[0001]本公开涉及推荐系统领域,尤其涉及一种内容召回方法、装置、服务器及存储介质。

技术介绍

[0002]随着信息技术和互联网技术的发展,人们从信息匮乏时代步入了信息过载时代,在这种时代背景下,人们越来越难从大量的信息中找到自身感兴趣的信息,信息也越来越难展示给可能对它感兴趣的用户,而推荐系统的任务就是连接用户和信息,创造价值。
[0003]通常,推荐系统可以采用召回阶段和排序阶段两个阶段。其中,召回阶段的主要目标是将用户可能喜欢的内容筛选出来,避免漏掉用户可能会喜欢的内容。但是,目前并不存在一种较为合适的内容召回方法。

技术实现思路

[0004]本公开提供了一种内容召回方法、装置、服务器及存储介质,以提升召回的内容质量,提高召回率和精确率。
[0005]第一方面,本公开提供一种内容召回方法,包括:获得候选推荐内容,候选推荐内容包括已曝光内容;对已曝光内容进行特征提取,获得消费行为特征,消费行为特征用于表示已曝光内容对应的消费行为;通过已训练的召回模型,根据消费行为特征,从已曝光内容中确定待推荐内容,其中,召回模型至少是基于预设时间段内的曝光未消费内容出现的频次确定的。
[0006]在一些可能的实施方式中,已曝光内容包括:曝光已消费内容和曝光未消费内容。
[0007]在一些可能的实施方式中,方法还包括:将预设时间段内的曝光已消费内容确定为正样本;在候选样本中,根据采样权重值进行负采样,得到正样本对应的负样本,采样权重值是基于候选样本中在预设时间段内的每个曝光未消费内容的出现频次确定的;基于正样本以及负样本,训练召回模型。
[0008]在一些可能的实施方式中,方法还包括:确定候选样本,候选样本中的负样本为预设时间段内的曝光未消费内容;统计预设时间段内负样本出现的频次;根据负样本出现的频次,确定采样权重值。
[0009]在一些可能的实施方式中,方法还包括:计算召回模型对应的基尼系数;根据基尼系数,调整采样权重。
[0010]在一些可能的实施方式中,调整采样权重,包括:当基尼系数满足第一预设条件时,增大采样权重;或,当基尼系数满足第二预设条件时,减小采样权重。
[0011]第二方面,本公开提供一种内容召回装置,该装置可以为服务器中的芯片或者片上系统,还可以为计算机中用于实现第一方面及其任一种可能的实施方式所述方法的功能模块。该内容召回装置可以实现第一方面及其任一种可能的实施方式所述服务器所执行的功能,所述功能可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个上述
功能相应的模块。该内容召回装置包括:获得模块,用于获得候选推荐内容,候选推荐内容包括已曝光内容;提取模块,用于对已曝光内容进行特征提取,获得消费行为特征,消费行为特征用于表示已曝光内容对应的消费行为;召回模块,用于通过已训练的召回模型,根据消费行为特征,从已曝光内容中确定待推荐内容,其中,召回模型至少是基于预设时间段内的曝光未消费内容出现的频次确定的。
[0012]在一些可能的实施方式中,装置中已曝光内容包括:曝光已消费内容和曝光未消费内容。
[0013]在一些可能的实施方式中,召回模块,用于将预设时间段内的曝光已消费内容确定为正样本;在候选样本中根据采样权重值进行负采样,得到正样本对应的负样本,采样权重值是基于候选样本中在预设时间段内的每个曝光未消费内容的出现频次确定的;基于正样本以及负样本,训练召回模型。
[0014]在一些可能的实施方式中,召回模块,用于确定候选样本,候选样本中的负样本为预设时间段内的曝光未消费内容;统计预设时间段内负样本出现的频次;根据负样本出现的频次,确定采样权重值。
[0015]在一些可能的实施方式中,召回模块,用于计算召回模型对应的基尼系数;根据基尼系数,调整采样权重。
[0016]在一些可能的实施方式中,召回模块,用于调整采样权重,包括:当基尼系数满足第一预设条件时,增大采样权重;或,当基尼系数满足第二预设条件时,减小采样权重。
[0017]第三方面,本公开提供一种服务器,包括:用于存储处理器可执行指令的存储器;处理器;其中,处理器被配置为:用于执行可执行指令时,以实现如第一方面及其任一可能的实施方式所述的方法。
[0018]第四方面,本公开提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,计算机可执行指令被处理器执行后能够实现如第一方面及其任一可能的实施方式所述的方法。
[0019]本公开提供的技术方案与现有技术相比存在的有益效果是:
[0020]在本公开的方案,采用至少基于预设时间段内的曝光未消费内容的频次确定的召回模型,对候选推荐内容进行召回,使得曝光频次相同的条件下,低消费的内容负采样概率更高,会更多的出现在负样本中,使得低质内容在召回模型中被打压,优质内容则更容易被召回,从而提升召回的内容质量,进而提高内容召回的召回率和精确率。
[0021]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开的保护范围。
附图说明
[0022]图1为本公开实施例中的内容召回方法的一种实施流程示意图;
[0023]图2为本公开实施例中的召回模型训练方法的实施流程示意图;
[0024]图3为本公开实施例中的内容召回装置的一种结构示意图;
[0025]图4为本公开实施例中的一种服务器的结构示意图。
具体实施方式
[0026]以下描述中,参考形成本公开一部分并以说明的方式示出本公开实施例的具体方面或可使用本公开实施例的具体方面的附图。应理解,本公开实施例可在其它方面中使用,并可包括附图中未描绘的结构或逻辑变化。因此,以下详细描述不应以限制性的意义来理解,且本公开的范围由所附权利要求书界定。例如,应理解,结合所描述方法的揭示内容可以同样适用于用于执行所述方法的对应设备或装置,且反之亦然。例如,如果描述一个或多个具体方法步骤,则对应的设备可以包含如功能单元等一个或多个单元,来执行所描述的一个或多个方法步骤(例如,一个单元执行一个或多个步骤,或多个单元,其中每个都执行多个步骤中的一个或多个),即使附图中未明确描述或说明这种一个或多个单元。另一方面,例如,如果基于如功能单元等一个或多个单元描述具体装置,则对应的方法可以包含一个步骤来执行一个或多个单元的功能性(例如,一个步骤执行一个或多个单元的功能性,或多个步骤,其中每个执行多个单元中一个或多个单元的功能性),即使附图中未明确描述或说明这种一个或多个步骤。进一步,应理解的是,除非另外明确提出,本文中所描述的各示例性实施例和/或方面的特征可以相互组合。
[0027]随着信息技术和互联网技术的发展,人们从信息匮乏时代步入了信息过载时代,在这种时代背景下,人们越来越难从大量的信息中找到自身感兴趣的信息,信息也越来越难展示给可能对它感兴趣的用户,而推荐系统的任务就是连接用户和信息,创造价值。
[0028本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容召回方法,其特征在于,所述方法包括:获得候选推荐内容,所述候选推荐内容包括已曝光内容;对所述已曝光内容进行特征提取,获得消费行为特征,所述消费行为特征用于表示所述已曝光内容对应的消费行为;通过已训练的召回模型,根据所述消费行为特征,从所述已曝光内容中确定待推荐内容,其中,所述召回模型至少是基于预设时间段内的曝光未消费内容出现的频次确定的。2.根据权利要求1所述的方法,其特征在于,所述已曝光内容包括:曝光已消费内容和曝光未消费内容。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:将预设时间段内的所述曝光已消费内容确定为正样本;在候选样本中,根据采样权重值进行负采样,得到所述正样本对应的负样本,所述采样权重值是基于所述候选样本中在所述预设时间段内的每个曝光未消费内容的出现频次确定的;基于所述正样本以及所述负样本,训练所述召回模型。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:确定所述候选样本,所述候选样本中的负样本为所述预设时间段内的曝光未消费内容;统计所述预设时间段内所述负样本出现的频次;根据所述负样本出现的频次,确定所述采样权重值。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:计算所述召回模型对应的基尼系数;根据所述基尼系数,调整所述采样权重。6.根据权利要求5所述的方法,其特征在于,所述调整所述采样权重,包括:当所述基尼系数满足第一预设条件时,增大所述采样权重;或,当所述基尼系数满足第二预设条件时,减小所述采样权重。7.一种内容召回装置,其特征在于,所述装置包括:获得模块,用于获得候选推荐内容,所述候选推荐内容包括已曝光内容;提取模块,用于对所述已曝光内容进行特征提取,获得消费行为特征,所述消费行为特征用于表示所述已曝光...

【专利技术属性】
技术研发人员:陈振岳金长虎
申请(专利权)人:北京快乐茄信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1