一种基于参数配置的推荐系统召回方法及系统技术方案

技术编号:23288218 阅读:19 留言:0更新日期:2020-02-08 18:14
本发明专利技术公开了一种基于参数配置的推荐系统召回方法及系统,通过可参数配置化的融合策略,使召回结果既考虑到了用户的实时兴趣倾向,也兼顾到了用户的离线长期爱好需求,从而真实反映用户的兴趣爱好,实现不同Batch召回结果的自动化融合,并将基于业务理解的参数权重考虑到召回集融合中,并通过参数的变化,大大提升了召回集生成的灵活性,方便不同召回策略之间的abtest测试比较,可帮助算法工程师对召回集在短期兴趣和长期兴趣之间找到很好的平衡点,同时保障了后续精排序结果的多样性,使推荐结果更加合理,提升用户体验。

A recall method and system of recommendation system based on parameter configuration

【技术实现步骤摘要】
一种基于参数配置的推荐系统召回方法及系统
本专利技术涉及数据处理
,尤其涉及一种基于参数配置的推荐系统召回方法及系统。
技术介绍
在网络音乐平台中,通常通过音频专辑推荐系统为用户推荐用户感兴趣的音频专辑,而音频专辑推荐系统中最重要的一个环节是推荐算法,推荐算法包含了粗排序召回和精排序Ranking部分。根据业务特点的不同,需要综合的考虑召回粗排和精排序的关系。在召回集生成部分,需要考虑用户的长期行为也就是历史行为,也需要考虑用户的实时行为需求。两者各有优劣,历史行为更新时间慢,但是数据多可以从全局来考虑,实时行为更新速度快,可以快速反应用户的实时兴趣偏好,但数据比较少。但是如何融合这两者,使得推荐结果更加合理,从而提升用户体验,是目前亟待解决的问题。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一,特别创新地提出了一种基于参数配置的推荐系统召回方法及系统,通过配置参数,既可兼顾考虑到用户的实时兴趣趋势和历史兴趣,实现不同Batch召回结果的自动化融合,并将基于业务理解的参数权重考虑到召回集融合中,并通过参数的变化,大大提升了召回集生成的灵活性,方便不同召回策略之间的abtest测试比较,可帮助算法工程师对召回集在短期兴趣和长期兴趣之间找到很好的平衡点,同时保障了后续精排序结果的多样性,使推荐结果更加合理,提升用户体验。为了实现本专利技术的上述目的,根据本专利技术的第一个方面,本专利技术提供了一种基于参数配置的推荐系统召回方法,所述方法包括如下步骤:S1,判断用户操作是否满足推荐触发条件:当用户操作不满足所述推荐触发条件时,执行步骤S2;当用户操作满足所述推荐触发条件时,执行步骤S3~S7;S2,基于用户操作召回预设的音频专辑;S3,当用户触发的第i个Batch到来时,近实时的生成当前Batch的召回数据集,并将召回数据集中的音频专辑按照召回算法的打分进行排序,i为正整数;S4,融合包含当前Batch的召回数据集在内的该用户过去n次的召回数据集,并按各个召回集生成时间的先后顺序进行排序,n为大于1的正整数;S5,按照距离第i次召回时间远近,设置各个召回数据集的融合排序权重参数,将融合排序权重参数和步骤S3中对应的第i个Batch的原始打分相乘,得到新的打分结果,按照新的打分结果重新降序重排融合后的召回数据集中的所有音频专辑;S6,调节各个融合排序权重参数的权重大小,得到初始排序结果;S7,基于初始排序结果进行数据去重,按照最终打分重新降序排序得到TopN的最终召回集,N为正整数。优选地,所述方法还包括:定义所述推荐触发条件。优选地,所述基于用户操作召回预设的音频专辑包括:基于用户操作获取所述用户的用户ID;基于所述用户ID在数据库中搜索与所述用户ID匹配的预设的音频专辑;将搜索到的预设的音频专辑作为最终召回集。优选地,所述调节各个融合排序权重参数的权重大小,得到初始排序结果包括:调节参数各个融合排序权重参数的权重大小,配置当前Batch的召回数据集的融合排序权重参数为最大,其余召回数据集的融合排序权重参数按当前排序呈递减或固定状态,根据调节后的权重参数得到初始排序结果。优选地,所述基于初始排序结果进行数据去重包括:将初始排序结果中的各个音频专辑中所有的专辑名相同但打分不同的音频专辑,只保留打分最高的那个音频专辑。根据本专利技术的第二个方面,本专利技术提供了一种基于参数配置的推荐系统召回系统,所述系统包括:判断模块,用于判断用户操作是否满足推荐触发条件;第一召回模块,用于当用户操作不满足所述推荐触发条件时,基于用户操作召回预设的音频专辑;当前召回数据集生成模块,用于当用户操作满足所述推荐触发条件时,在用户触发的第i个Batch到来时,近实时的生成当前Batch的召回数据集,并将召回数据集中的音频专辑按照召回算法的打分进行排序,i为正整数;数据集融合模块,用于融合包含当前Batch的召回数据集在内的该用户过去n次的召回数据集,并按各个召回集生成时间的先后顺序进行排序,n为大于1的正整数;数据排序模块,用于按照距离第i次召回时间远近,设置各个召回数据集的融合排序权重参数,将融合排序权重参数和对应的第i个Batch的原始打分相乘,得到新的打分结果,按照新的打分结果重新降序重排融合后的召回数据集中的所有音频专辑;权重配置模块,用于调节各个融合排序权重参数的权重大小,得到初始排序结果;最终召回集生成模块,用于基于初始排序结果进行数据去重,按照最终打分重新降序排序得到TopN的最终召回集,N为正整数。优选地,所述系统还包括:定义模块,用于定义所述推荐触发条件。优选地,所述基于用户操作召回预设的音频专辑包括:基于用户操作获取所述用户的用户ID;基于所述用户ID在数据库中搜索与所述用户ID匹配的预设的音频专辑;将搜索到的预设的音频专辑作为最终召回集。优选地,所述调节各个融合排序权重参数的权重大小,得到初始排序结果包括:调节参数各个融合排序权重参数的权重大小,配置当前Batch的召回数据集的融合排序权重参数为最大,其余召回数据集的融合排序权重参数按当前排序呈递减或固定状态,根据调节后的权重参数得到初始排序结果。优选地,所述基于初始排序结果进行数据去重包括:将初始排序结果中的各个音频专辑中所有的专辑名相同但打分不同的音频专辑,只保留打分最高的那个音频专辑。由以上方案可知,本专利技术提供了一种基于参数配置的推荐系统召回方法及系统,所述方法包括判断用户操作是否满足推荐触发条件;当用户操作不满足所述推荐触发条件时,基于用户操作召回预设的音频专辑;当用户操作满足所述推荐触发条件时,在用户触发的第i个Batch到来时,近实时的生成当前Batch的召回数据集,并将召回数据集中的音频专辑按照召回算法的打分进行排序,i为正整数;融合包含当前Batch的召回数据集在内的该用户过去n次的召回数据集,并按各个召回集生成时间的先后顺序进行排序,n为大于1的正整数;按照距离第i次召回时间远近,设置各个召回数据集的融合排序权重参数,将融合排序权重参数和对应的第i个Batch的原始打分相乘,得到新的打分结果,按照新的打分结果重新降序重排融合后的召回数据集中的所有音频专辑;调节各个融合排序权重参数的权重大小,得到初始排序结果;基于初始排序结果进行数据去重,按照最终打分重新降序排序得到TopN的最终召回集,N为正整数。本专利技术通过配置参数,既可兼顾考虑到用户的实时兴趣趋势和历史兴趣,实现不同Batch召回结果的自动化融合,并将基于业务理解的参数权重考虑到召回集融合中,并通过参数的变化,大大提升了召回集生成的灵活性,方便不同召回策略之间的abtest测试比较,可帮助算法工程师对召回集在短期兴趣和长期兴趣之间找到很好的平衡点,同时保障了后续精排序结果的多样性,使推荐结果更加合理,提升用户体验。本文档来自技高网...

【技术保护点】
1.一种基于参数配置的推荐系统召回方法,其特征在于,所述方法包括:/nS1,判断用户操作是否满足推荐触发条件:/n当用户操作不满足所述推荐触发条件时,执行步骤S2;/n当用户操作满足所述推荐触发条件时,执行步骤S3~S7;/nS2,基于用户操作召回预设的音频专辑;/nS3,当用户触发的第i个Batch到来时,近实时的生成当前Batch的召回数据集,并将召回数据集中的音频专辑按照召回算法的打分进行排序,i为正整数;/nS4,融合包含当前Batch的召回数据集在内的该用户过去n次的召回数据集,并按各个召回集生成时间的先后顺序进行排序,n为大于1的正整数;/nS5,按照距离第i次召回时间远近,设置各个召回数据集的融合排序权重参数,将融合排序权重参数和步骤S3中对应的第i个Batch的原始打分相乘,得到新的打分结果,按照新的打分结果重新降序重排融合后的召回数据集中的所有音频专辑;/nS6,调节各个融合排序权重参数的权重大小,得到初始排序结果;/nS7,基于初始排序结果进行数据去重,按照最终打分重新降序排序得到TopN的最终召回集,N为正整数。/n

【技术特征摘要】
1.一种基于参数配置的推荐系统召回方法,其特征在于,所述方法包括:
S1,判断用户操作是否满足推荐触发条件:
当用户操作不满足所述推荐触发条件时,执行步骤S2;
当用户操作满足所述推荐触发条件时,执行步骤S3~S7;
S2,基于用户操作召回预设的音频专辑;
S3,当用户触发的第i个Batch到来时,近实时的生成当前Batch的召回数据集,并将召回数据集中的音频专辑按照召回算法的打分进行排序,i为正整数;
S4,融合包含当前Batch的召回数据集在内的该用户过去n次的召回数据集,并按各个召回集生成时间的先后顺序进行排序,n为大于1的正整数;
S5,按照距离第i次召回时间远近,设置各个召回数据集的融合排序权重参数,将融合排序权重参数和步骤S3中对应的第i个Batch的原始打分相乘,得到新的打分结果,按照新的打分结果重新降序重排融合后的召回数据集中的所有音频专辑;
S6,调节各个融合排序权重参数的权重大小,得到初始排序结果;
S7,基于初始排序结果进行数据去重,按照最终打分重新降序排序得到TopN的最终召回集,N为正整数。


2.根据权利要求1所述的基于参数配置的推荐系统召回方法,其特征在于,所述方法还包括:
定义所述推荐触发条件。


3.根据权利要1或2所述的基于参数配置的推荐系统召回方法,其特征在于,所述基于用户操作召回预设的音频专辑包括:
基于用户操作获取所述用户的用户ID;
基于所述用户ID在数据库中搜索与所述用户ID匹配的预设的音频专辑;
将搜索到的预设的音频专辑作为最终召回集。


4.根据权利要求1或2所述的基于参数配置的推荐系统召回方法,其特征在于,所述调节各个融合排序权重参数的权重大小,得到初始排序结果包括:
调节参数各个融合排序权重参数的权重大小,配置当前Batch的召回数据集的融合排序权重参数为最大,其余召回数据集的融合排序权重参数按当前排序呈递减或固定状态,根据调节后的权重参数得到初始排序结果。


5.根据权利要4所述的基于参数配置的推荐系统召回方法,其特征在于,所述基于初始排序结果进行数据去重包括:
将初始排序结果中的各个音频专辑中所有的专辑名相同但打分不同的音频专辑,只保留打分最高的那个音频专辑。


6.一种基于参...

【专利技术属性】
技术研发人员:徐文铭杨晶生
申请(专利权)人:上海麦克风文化传媒有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1