参数调整方法、装置、推荐系统、电子设备及存储介质制造方法及图纸

技术编号:33378645 阅读:10 留言:0更新日期:2022-05-11 22:47
本申请实施例提供了一种参数调整方法、装置、推荐系统、电子设备及存储介质,解决了人工手动调节推荐系统中参数的方式过于依赖规则设计和人工经验,调节效率较低,维护成本较高,且当参数组合中的参数变多后,难以实现全局调优的问题,所述参数调整方法,包括:响应于针对推荐系统中子模块的参数调整请求;获取上一测试周期内上一轮次的N组参数组合的反馈指标,其中,每组参数组合的反馈指标为每组测试对象使用所述参数组合对应的执行行为指标,所述N组参数组合是基于预设进化策略算法生成的;根据所述上一轮次的N组参数组合的反馈指标与所述预设进化策略算法生成新一轮次的N组参数组合。合。合。

【技术实现步骤摘要】
参数调整方法、装置、推荐系统、电子设备及存储介质


[0001]本申请涉及个计算机
,尤其涉及参数调整方法、装置、推荐系统、电子设备及存储介质。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,推荐系统是根据用户的信息需求、用户上网行为等,将用户感兴趣的信息(如新闻、视频、广告等)、物品等推荐给用户的个性化信息推荐系统。与传统的搜索引擎不同,推荐系统通过研究用户的兴趣偏好,进行个性化计算以发现用户的兴趣点,从而引导用户发现自己的信息需求。推荐系统的推荐流程一般可以包括内容召回、过滤、排序等环节,在召回、排序等环节中通常使用人工智能中的机器学习算法模型为待推荐用户和内容进行打分来筛选推荐的内容。
[0004]在推荐系统的子模块中通常会使用规则控制或算法模型,各子模块中涉及多个参数组合,例如,排序模块中通常使用多个排序子模型,排序依据是将各个排序子模型预估得到的内容进行打分后进行加权融合,各排序子模型各自对应的权重即为排序模块的一组参数组合,又如,过滤模块中的多个阈值组合,重排模块中的多样性控制参数组合等。在推荐系统使用过程中,通常需要调节各个子模块中的参数组合,寻找更优的参数,使得推荐系统达到更佳的推荐效果。相关技术中,针对推荐系统的各子模块中的参数组合的调节通常采用人工手动调节的方式,根据人工经验手动设置参数组合中的各参数,然而,这种人工手动调节的方式过于依赖规则设计和人工经验,调节效率较低,维护成本较高,并且,当参数组合中的参数变多后,难以实现全局调优。

技术实现思路

[0005]为解决
技术介绍
中的问题,本申请实施例提供了一种参数调整方法、装置、推荐系统、电子设备及存储介质。
[0006]一方面,本申请实施例提供了一种参数调整方法,包括:
[0007]响应于针对推荐系统中子模块的参数调整请求;
[0008]获取上一测试周期内上一轮次的N组参数组合的反馈指标,其中,每组参数组合的反馈指标为每组测试对象使用相应参数组合对应的执行行为指标,所述N组参数组合是基于预设进化策略算法生成的;
[0009]根据所述上一轮次的N组参数组合的反馈指标与所述预设进化策略算法生成新一轮次的N组参数组合。
[0010]在一种可能的实施方式中,根据所述上一轮次的N组参数组合的反馈指标与所述预设进化策略算法生成新一轮次的N组参数组合,具体包括:
[0011]根据所述上一轮次的N组参数组合的反馈指标和预设回报函数,确定所述上一轮次的N组参数组合各自对应的回报值;
[0012]将所述上一轮次的N组参数组合按照回报值从高到低的顺序进行排列,从前至后选取预设比例的参数组合;
[0013]计算选取的各参数组合的每一参数的均值和方差;
[0014]基于所述预设进化策略算法按照预设迭代次数进行迭代,生成满足所述每一参数的均值和方差的高斯分布的新一轮次的N组参数组合。
[0015]在一种可能的实施方式中,根据所述上一轮次的N组参数组合的反馈指标和预设回报函数,确定所述上一轮次的N组参数组合各自对应的回报值,具体包括:
[0016]对所述上一轮次的每一组参数组合的每一反馈指标分别进行排序;
[0017]根据所述每一组参数组合的每一反馈指标对应的排列位数与所述每一反馈指标各自对应的权重,确定所述上一轮次的每一组参数组合对应的回报值。
[0018]在一种可能的实施方式中,所述预设回报函数为:
[0019][0020]其中,reward
j
表示上一轮次的第j组参数组合的回报,j=1~N;
[0021]ω
i
表示所述第j组参数组合的第i个反馈指标对应的权重,i=1~m,m为反馈指标的个数,
[0022]l
i
表示所述第j组参数组合的第i个反馈指标的排列位数。
[0023]在一种可能的实施方式中,在计算出选取的各参数组合的每一参数的方差之后,还包括:
[0024]根据设定扰动方差、设定最大扰动轮次和当前迭代轮次确定所述方差对应的偏移方差;
[0025]分别对所述每一参数的方差加入所述偏移方差。
[0026]在一种可能的实施方式中,根据设定扰动方差和设定最大扰动轮次确定所述方差对应的偏移方差,具体包括:
[0027]通过以下公式确定所述方差对应的偏移方差:
[0028][0029]其中,σ

表示所述方差对应的偏移方差;
[0030]p表示当前迭代轮次;
[0031]Δt表示所述设定最大扰动轮次;
[0032]Δσ表示所述设定扰动方差。
[0033]一方面,本申请实施例提供了一种参数调整装置,包括:
[0034]响应单元,用于响应于针对推荐系统中子模块的参数调整请求;
[0035]获取单元,用于获取上一测试周期内上一轮次的N组参数组合的反馈指标,其中,每组参数组合的反馈指标为每组测试对象使用相应参数组合对应的执行行为指标,所述N
组参数组合是基于预设进化策略算法生成的;
[0036]生成单元,用于根据所述上一轮次的N组参数组合的反馈指标与所述预设进化策略算法生成新一轮次的N组参数组合。
[0037]在一种可能的实施方式中,所述生成单元,具体用于:
[0038]根据所述上一轮次的N组参数组合的反馈指标和预设回报函数,确定所述上一轮次的N组参数组合各自对应的回报值;
[0039]将所述上一轮次的N组参数组合按照回报值从高到低的顺序进行排列,从前至后选取预设比例的参数组合;
[0040]计算选取的各参数组合的每一参数的均值和方差;
[0041]基于所述预设进化策略算法按照预设迭代次数进行迭代,生成满足所述每一参数的均值和方差的高斯分布的新一轮次的N组参数组合。
[0042]在一种可能的实施方式中,所述生成单元,具体用于:
[0043]对所述上一轮次的每一组参数组合的每一反馈指标分别进行排序;
[0044]根据所述每一组参数组合的每一反馈指标对应的排列位数与所述每一反馈指标各自对应的权重,确定所述上一轮次的每一组参数组合对应的回报值。
[0045]在一种可能的实施方式中,所述预设回报函数为:
[0046][0047]其中,reward
j
表示上一轮次的第j组参数组合的回报,j=1~N;
[0048]ω
i
表示所述第j组参数组合的第i个反馈指标对应的权重,i=1~m,m为反馈指标的个数,
[0049]l
i
表示所述第j组参数组合的第i个反馈指标的排列位数。
[0050]在一种可能的实施方式中,所述装置,还包括:
[0051]确定单元,用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种参数调整方法,其特征在于,包括:响应于针对推荐系统中子模块的参数调整请求;获取上一测试周期内上一轮次的N组参数组合的反馈指标,其中,每组参数组合的反馈指标为每组测试对象使用相应参数组合对应的执行行为指标,所述N组参数组合是基于预设进化策略算法生成的;根据所述上一轮次的N组参数组合的反馈指标与所述预设进化策略算法生成新一轮次的N组参数组合。2.根据权利要求1所述的方法,其特征在于,根据所述上一轮次的N组参数组合的反馈指标与所述预设进化策略算法生成新一轮次的N组参数组合,具体包括:根据所述上一轮次的N组参数组合的反馈指标和预设回报函数,确定所述上一轮次的N组参数组合各自对应的回报值;将所述上一轮次的N组参数组合按照回报值从高到低的顺序进行排列,从前至后选取预设比例的参数组合;计算选取的各参数组合的每一参数的均值和方差;基于所述预设进化策略算法按照预设迭代次数进行迭代,生成满足所述每一参数的均值和方差的高斯分布的新一轮次的N组参数组合。3.根据权利要求2所述的方法,其特征在于,根据所述上一轮次的N组参数组合的反馈指标和预设回报函数,确定所述上一轮次的N组参数组合各自对应的回报值,具体包括:对所述上一轮次的每一组参数组合的每一反馈指标分别进行排序;根据所述每一组参数组合的每一反馈指标对应的排列位数与所述每一反馈指标各自对应的权重,确定所述上一轮次的每一组参数组合对应的回报值。4.根据权利要求3所述的方法,其特征在于,所述预设回报函数为:其中,reward
j
表示上一轮次的第j组参数组合的回报,j=1~N;ω
i
表示所述第j组参数组合的第i个反馈指标对应的权重,i=1~m,m为反馈指标的个数,l
...

【专利技术属性】
技术研发人员:吴迪
申请(专利权)人:网易传媒科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1