System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,尤其涉及一种针对不准确伪标签的双稳健去偏推荐方法及装置。
技术介绍
1、去偏已经在推荐系统中广泛研究。由于去偏,许多推荐系统中的任务得到了显著发展,例如评分预测,点击后转化率预测,查看后点击且转化率预测,以及提升建模。这些任务的一个重要且普遍的问题是,由于用户自我选择和系统过滤的原因,收集到的数据中的标签(例如,评分、点击、购买)总不是目标人群中标签的代表性样本。由于标签仅在收集到的数据中可观测,而在目标人群中缺失严重,因此这对于实现无偏学习构成了巨大的挑战。
2、为了解决这一问题,现有技术通常需要基于误差插补的方法,首先插补缺失的标签(称为伪标签),然后使用观察到的标签和伪标签训练预测模型。然而,由于标签插补模型是使用观察到的数据进行训练的,而应用于缺失数据中,因而难以获得准确的伪标签,从而导致次优的性能。
技术实现思路
1、鉴于此,本专利技术的实施例提供了一种针对不准确伪标签的双稳健去偏推荐方法,以消除或改善现有技术中存在的一个或更多个缺陷。
2、本专利技术的一个方面提供了一种针对不准确伪标签的双稳健去偏推荐方法,所述方法的步骤包括:
3、基于预设的训练数据集对第一倾向性得分模型进行训练,基于完成训练的第一倾向性得分模型计算第一损失函数,基于第一损失函数对第二倾向性得分模型进行训练,所述第二倾向性得分模型用于输出预测的倾向性得分值;
4、基于所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数,基于第二损
5、基于插补模型输出预测的伪标签值和完成训练的第二倾向性得分模型输出预测的倾向性得分值计算第三损失函数,基于第三损失函数对预测模型进行训练;
6、基于完成训练的所述预测模型进行结果预测。
7、采用上述方案,首先,本方案的插补模型并不基于数据集直接进行训练,而是通过结合第二倾向性得分模型输出的倾向性得分值和数据集联合进行训练,提高标签的准确度,进一步地,本方案预测模型的训练过程中,基于完成训练的插补模型输出伪标签值和完成训练的第二倾向性得分模型输出的倾向性得分值计算第三损失函数,通过两个模型联合对第三个模型进行训练,并不是简单通过补充标签进行训练,提高了最终预测模型的预测准确度。
8、在本专利技术的一些实施方式中,在基于完成训练的第一倾向性得分模型计算第一损失函数的步骤中,
9、基于所述预测模型对于输入的训练数据输出的预测值和训练数据的计算标签值计算第四损失函数;
10、基于所述第四损失函数的值和完成训练的第一倾向性得分模型计算第一损失函数。
11、在本专利技术的一些实施方式中,在基于所述预测模型对于输入的训练数据输出的预测值和训练数据的计算标签值计算第四损失函数的步骤中,基于如下公式计算第四损失函数:
12、
13、其中,表示用户u和商品i的组合对应的计算标签值为r的训练数据对应的第四损失函数,表示预测模型对于用户u和商品i的组合对应的训练数据输出的预测值。
14、在本专利技术的一些实施方式中,在基于所述第四损失函数的值和完成训练的第一倾向性得分模型计算第一损失函数的步骤中,基于如下公式计算第一损失函数:
15、
16、其中,表示第一损失函数,表示所有用户集合,u表示任一用户,表示所有商品集合,i表示任一商品,表示完成训练的第一倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的初始倾向性得分,表示第二倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的倾向性得分值,γ表示预设的权衡超参数,λu和λi分别表示对应用户u和商品i预设的计算参数,表示用户u和商品i的组合带入计算标签值为1的训练数据得到的第四损失函数,表示用户u和商品i的组合带入计算标签值为0的训练数据得到的第四损失函数,ou,i表示训练数据的标签指示值。
17、在本专利技术的一些实施方式中,在基于所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,
18、基于实际标签值和所述预测模型对于输入的训练数据输出的预测值计算第五损失函数;
19、基于插补模型输出预测的伪标签值和所述预测模型对于输入的训练数据输出的预测值计算第六损失函数;
20、基于所述第五损失函数、第六损失函数和所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数。
21、在本专利技术的一些实施方式中,在基于所述第五损失函数、第六损失函数和所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,根据如下公式计算第二损失函数:
22、
23、其中,表示第二损失函数,d表示用户和商品的组合总数量,表示所有用户集合,u表示任一用户,表示所有商品集合,i表示任一商品,δu,i表示第五损失函数,表示第六损失函数,ou,i表示训练数据的标签指示值,表示第二倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的倾向性得分值。
24、在具体实施过程中,标签指示值表示该用户商品组合的实际标签值是否被观测到,若该用户商品组合的实际标签值被观测到,则标签指示值为1;否则为0,表示用户商品组合的实际标签值未被观测到。
25、在本专利技术的一些实施方式中,在基于插补模型输出预测的伪标签值和训练数据的实际标签值计算第五损失函数的步骤中,根据如下公式计算第五损失函数:
26、
27、其中,ru,i表示用户u和商品i对应的实际标签值,δu,i对于用户u和商品i的组合对应的训练数据对应的第五损失函数,表示用户u和商品i的组合带入计算标签值为1的训练数据得到的第四损失函数,表示用户u和商品i的组合带入计算标签值为0的训练数据得到的第四损失函数;
28、在基于插补模型输出预测的伪标签值和所述预测模型对于输入的训练数据输出的预测值计算第六损失函数的步骤中,根据如下公式计算第六损失函数:
29、
30、其中,表示插补模型对于用户u和商品i的组合输出预测的伪标签值,对于用户u和商品i的组合对应的训练数据对应的第六损失函数。
31、在本专利技术的一些实施方式中,在基于插补模型输出预测的伪标签值和完成训练的第二倾向性得分模型输出预测的倾向性得分值计算第三损失函数的步骤中,基于如下公式计算第三损失函数:
32、
33、其中,表示第三损失函数,|d|表示用户和商品的组合总数量,表示所有用户集合,u表示任一用户,表示所有商品集合,i表示任一商品,δu,i表示第五损失函数,表示第六损失函数,ou,i表示训练数据的标签指示值,表示第二倾向性得分模型对于用户u和商品i的组合对应的训练数据输出的倾向性得分值。
34、在本专利技术的一些实施方式中,在基于完成训练的所述预测模型进行结果预测的步骤中,所述预测模型需要完成预设轮次的训练,在每轮次的训练中顺序执行第本文档来自技高网...
【技术保护点】
1.一种针对不准确伪标签的双稳健去偏推荐方法,其特征在于,所述方法的步骤包括:
2.根据权利要求1所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于完成训练的第一倾向性得分模型计算第一损失函数的步骤中,
3.根据权利要求2所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述预测模型对于输入的训练数据输出的预测值和训练数据的计算标签值计算第四损失函数的步骤中,基于如下公式计算第四损失函数:
4.根据权利要求2所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述第四损失函数的值和完成训练的第一倾向性得分模型计算第一损失函数的步骤中,基于如下公式计算第一损失函数:
5.根据权利要求1所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,
6.根据权利要求5所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述第五损失函数、第六损失函数和所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,根
7.根据权利要求5所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于插补模型输出预测的伪标签值和训练数据的实际标签值计算第五损失函数的步骤中,根据如下公式计算第五损失函数:
8.根据权利要求1所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于插补模型输出预测的伪标签值和完成训练的第二倾向性得分模型输出预测的倾向性得分值计算第三损失函数的步骤中,基于如下公式计算第三损失函数:
9.根据权利要求1所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于完成训练的所述预测模型进行结果预测的步骤中,所述预测模型需要完成预设轮次的训练,在每轮次的训练中顺序执行第二倾向性得分模型、插补模型和的预测模型训练。
10.一种针对不准确伪标签的双稳健去偏推荐装置,其特征在于,该装置包括计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该装置实现如权利要求1-9任一项所述方法所实现的步骤。
...【技术特征摘要】
1.一种针对不准确伪标签的双稳健去偏推荐方法,其特征在于,所述方法的步骤包括:
2.根据权利要求1所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于完成训练的第一倾向性得分模型计算第一损失函数的步骤中,
3.根据权利要求2所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述预测模型对于输入的训练数据输出的预测值和训练数据的计算标签值计算第四损失函数的步骤中,基于如下公式计算第四损失函数:
4.根据权利要求2所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述第四损失函数的值和完成训练的第一倾向性得分模型计算第一损失函数的步骤中,基于如下公式计算第一损失函数:
5.根据权利要求1所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,
6.根据权利要求5所述的针对不准确伪标签的双稳健去偏推荐方法,其特征在于,在基于所述第五损失函数、第六损失函数和所述第二倾向性得分模型输出的倾向性得分值计算第二损失函数的步骤中,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。