一种多目标推荐模型的目标权值的自动调整方法技术

技术编号:37746521 阅读:11 留言:0更新日期:2023-06-05 23:32
本发明专利技术提供了一种多目标推荐模型的目标权值的自动调整方法,该自动调整方法包括构建MMOE多目标模型、设置各目标的初始权重、模型训练和根据模型训练指标对模型权重进行动态调整校正等步骤,能根据模型的优化情况对人工制定的权重进行动态调整校正,从而解决由于目标打分依赖人工输入,可能由于人为因素造成偏差的问题,并通过模型迭代优化,进一步根据模型的各目标优化情况对人工制定的初始目标权重进行再调整,有助于增加多目标模型的稳定性。性。性。

【技术实现步骤摘要】
一种多目标推荐模型的目标权值的自动调整方法


[0001]本专利技术涉及数据挖掘
,具体而言,涉及一种多目标推荐模型的目标权值的自动调整方法。

技术介绍

[0002]现有的多目标推荐模型中,主要使用MMOE(Modeling Task Relationships in Multi

task Learning with Multi

gate Mixture of Expert,基于混合专家控制门的多目标模型)建立多个目标输出,然后与目标权重进行加权融合输出。例如推荐模型有以下多个优化目标:点击率(点击次数/展示次数)、分享率(分享次数/展示次数)、浏览时长、其他人工规则等,在MMOE模型中会输出多个目标的输出,然后人工制定各个目标的权重,再根据多个目标的输出和目标的权重融合成一个输出分数最为最终推荐分数,最终推荐分数越高的文章会在网页中位置越靠前。
[0003]专利技术人发现这种方法的问题在于:目标一经确定无法根据模型的优化情况进行动态调整,人工分数如果不合理可能会导致模型优化难度增大。

技术实现思路

[0004]为了改善上述技术问题至少之一,本专利技术的一个目的在于提供一种多目标推荐模型的目标权值的自动调整方法,简称自动调整方法。
[0005]为实现上述目的,本专利技术的技术方案提供了一种多目标推荐模型的目标权值的自动调整方法,包括如下步骤:
[0006]步骤S2,构建多目标推荐模型,并为多目标推荐模型的各目标权值设定初始值;
>[0007]步骤S3,训练多目标推荐模型,并根据多目标推荐模型的训练指标对各目标权值进行动态调整校正;
[0008]其中,步骤S3包括:
[0009]将数据特征输入多目标推荐模型,得到多目标推荐模型的多个目标的损失函数值;
[0010]将各目标的损失函数值分别与对应的目标权值进行加权融合;
[0011]根据各目标的损失函数值对各目标权值的设定初始值进行动态校正,并进行模型迭代优化直至模型收敛。
[0012]本技术方案所提供的多目标推荐模型的目标权值的自动调整方法,通过将人工制定的初始目标权重和模型优化过程进行动态绑定,使得初始目标权重(即目标权值)也可以通过模型优化指标进行动态调整校正,一定程度上防止因为人工指定的初始权重和实际模型优化情况严重不符降低模型优化效果。
[0013]另外,本专利技术提供的上述技术方案中的多目标推荐模型的目标权值的自动调整方法还可以具有如下附加技术特征:
[0014]在上述技术方案中,在步骤S3中,目标权重的计算公式为:其中,
β
i
是目标权值的设定初始值,Wi为目标权重调整系数,
[0015]Li为目标i在多目标推荐模型的损失函数值,n为目标个数,δmin为调整系数的最低设定值、δmax为调整系数的最高设定值。
[0016]在上述技术方案中,在步骤S2之前还包括:步骤S1,对数据特征进行预处理;步骤S1具体包括:对数据特征中的连续型变量进行分箱处理,对数据特征中的类别变量进行哈希处理。
[0017]在上述技术方案中,在步骤S3之后还包括:步骤S4,模型迭代收敛后,将多目标推荐模型的多个目标分数和动态调整校正后的目标权重进行融合,得出多目标推荐模型的最终分数。
[0018]进一步地,多目标推荐模型的最终分数Y的计算公式为:其中,n为目标个数,Oi为多目标推荐模型的输出,为动态校正的目标权重。
[0019]在上述技术方案中,步骤S2中的各目标权值的初始值通过专家打分得到。
[0020]综上,本专利技术所提供的多目标推荐模型的目标权值的自动调整方法,能根据模型的优化情况对人工制定的权重进行动态调整校正,从而解决由于目标打分依赖人工输入,可能由于人为因素造成偏差的问题,并通过模型迭代优化,进一步根据模型的各目标优化情况对人工制定的初始目标权重进行再调整,有助于增加多目标模型的稳定性。
[0021]本专利技术的附加方面和优点将在下面的描述部分中变得明显,或通过本专利技术的实践了解到。
附图说明
[0022]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0023]图1是本专利技术的一些实施例的MMOE模型的示意图。
[0024]图2是本专利技术的一些实施例的自动调整方法的训练和动态调整校正的流程示意图。
具体实施方式
[0025]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0026]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用其他不同于在此描述的其他方式来实施,因此,本专利技术的保护范围并不受下面公开的具体实施例的限制。
[0027]本申请的一些实施例提供了一种多目标推荐模型的目标权值的自动调整方法,简称自动调整方法。
[0028]本实施例所提供的自动调整方法包括如下步骤:
[0029]步骤1:进行数据特征预处理,包括:连续特征(即连续型变量)进行分箱处理、文本特征(即类别变量)进行哈希处理;
[0030]步骤2:构建MMOE多目标模型,并进行权值初始化;
[0031]步骤3:通过专家打分得到各目标初始权重;
[0032]步骤4:对模型进行迭代优化和对专家打分得到的初始目标权重进行动态调整校正。先将数据特征输入MMOE模型,得到MMOE模型的多个目标的损失函数值,各目标的损失函数值分别与各个目标的权重进行加权融合,再用目标的损失函数值对专家打分的目标权重进行动态校正,再进行模型迭代优化直至模型收敛;
[0033]步骤5:模型迭代收敛后,将MMOE模型的多个目标分数和动态调整校正后的目标权重进行融合,得出最终模型的分数。
[0034]下面通过一个具体实施例做进一步说明。
[0035]数据说明:表1是本专利技术实施例的数据特征表,数据特征包括三方面:用户属性、物品属性、用户点击历史。用户属性包括:用户ID、年龄、性别、兴趣标签;物品特征包括:物品ID、物品标签;用户点击历史包括:用户点击的标签序列。
[0036][0037]表1数据特征
[0038]用户反馈数据,见表2,主要是用户根据推荐的物品进行反馈,包括:是否点击、是否收藏、是否分享。
[0039]用户ID物品ID是否点击是否收藏是否分享U1I1100U2I2010U3I3111
[0040]表2用户反馈数据
[0041]步骤1:数据预处理。将类别变量经过哈希处理成为整形变量,例如HASH(tag1)转化为521981;将连续型变量进行分箱,即根据分位数转换为对应的整形变量,如28对应的分位数为90%,转化为90;再将特征数据和用户反馈数据进行拼接,拼接结果如表3。
[0042][00本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多目标推荐模型的目标权值的自动调整方法,其特征在于,包括如下步骤:步骤S2,构建多目标推荐模型,并为所述多目标推荐模型的各目标权值设定初始值;步骤S3,训练多目标推荐模型,并根据多目标推荐模型的训练指标对各目标权值进行动态调整校正,包括:将数据特征输入多目标推荐模型,得到多目标推荐模型的多个目标的损失函数值;将各目标的损失函数值分别与对应的目标权值进行加权融合;根据各目标的损失函数值对各目标权值进行动态校正,并进行模型迭代优化直至模型收敛。2.根据权利要求1所述的多目标推荐模型的目标权值的自动调整方法,其特征在于,在步骤S3中,目标权重的计算公式为:其中,βi是目标权值的设定初始值,Wi为目标权重调整系数,Li为目标i在多目标推荐模型的损失函数值,表示全部目标在MMOE模型的损失函数值的总和,n为目标个数,δmin为调整系数的最低设定值、δmax为...

【专利技术属性】
技术研发人员:关兴
申请(专利权)人:中国舰船研究院中国船舶集团有限公司第七研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1