System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及人工智能,尤其涉及一种推荐模型的训练方法、推荐方法及电子设备。
技术介绍
1、随着人工智能技术的发展,推荐系统被广泛应用于各种领域。例如,推荐系统可以基于用户在历史时间段内购买的商品列表,预测用户下一步最可能购买的目标商品,进而向用户推荐该目标商品。或者,推荐系统可以基于用户在历史时间段内浏览/阅读的内容,预测用户下一步最可能浏览/阅读的目标内容,进而向用户推荐该目标内容。
2、上述推荐系统的推荐功能通常由预先训练的推荐模型实现。也就是说,在推荐系统上线之前,需要先基于大量样本用户的历史交互行为进行训练得到推荐模型。然而,上述训练过程中需要大量的样本数据,而目前从线上获得的样本数据具有稀疏性和噪声的问题,从而导致训练后的推荐模型的推荐准确率不高。
3、
技术介绍
部分的内容仅仅是专利技术人个人所知晓的信息,并不代表上述信息在本公开申请日之前已经进入公共领域,也不代表其可以成为本公开的现有技术。
技术实现思路
1、本说明书提供一种推荐模型的训练方法、推荐方法及电子设备,能够提高推荐结果的准确率。
2、第一方面,本说明书提供一种推荐模型的训练方法,包括:获得多个初始样本,每个所述初始样本包括样本用户按照时间顺序先后交互的多个项目;基于所述多个初始样本从至少两个对比维度构建得到对比样本集合,其中,所述至少两个对比维度包括:项目相关性对比维度和序列周期性对比维度;以及从所述至少两个对比维度对所述多个初始样本和所述对比样本集合进行对比学习,以得到所
3、在一些实施例中,所述对比样本集合包括第一对比样本子集和第二对比样本子集;所述基于所述多个初始样本从两个对比维度构建得到对比样本集合,包括:从所述项目相关性对比维度,对项目集合中的各项目进行样本扩增得到所述第一对比样本子集,其中,所述项目集合为所述多个初始样本中的所有项目所形成的集合,以及,从所述序列周期性对比维度,对所述多个初始样本中的各初始样本进行样本扩增得到所述第二对比样本子集。
4、在一些实施例中,所述第一对比样本子集包括:所述项目集合中的每个项目各自对应的多个第一对比样本;所述从所述项目相关性对比维度,对项目集合中的各项目进行样本扩增得到所述第一对比样本子集,包括:针对所述项目集合中的第i个项目,基于所述第i个项目与所述项目集合中的其他项目之间的相关程度,对所述第i个项目进行扩增得到所述第i个项目对应的所述多个第一对比样本,其中,所述i为小于或等于n的正整数,所述n为所述项目集合中包含的所述项目的数量。
5、在一些实施例中,所述第i个项目对应的所述多个第一对比样本包括:项目对比正例、项目对比负例、以及项目对比弱正例;所述基于所述第i个项目与所述项目集合中的其他项目之间的相关程度,对所述第i个项目进行扩增得到所述第i个项目对应的所述多个第一对比样本,包括:在所述项目集合中确定出至少一个第一相关项目、至少一个第二相关项目以及至少一个第三相关项目,其中,所述第一相关项目、所述第二相关项目、所述第三相关项目与所述第i个项目之间的相关程度依次降低,以及,基于所述至少一个第一相关项目生成所述项目对比正例,基于所述至少一个第二相关项目生成所述项目对比弱正例,并基于所述至少一个第三相关项目生成所述项目对比负例。
6、在一些实施例中,所述第一相关项目与所述第i个项目同属于所述多个初始样本中的其中一个;所述第二相关项目与所述第i个项目不同属于所述多个初始样本中的任何一个,且与所述第i个项目在特征空间中的距离大于预设距离;以及,所述第三相关项目与所述第i个项目不同属于所述多个初始样本中的任何一个,且与所述第i个项目在特征空间中的距离小于或等于所述预设距离。
7、在一些实施例中,所述基于所述至少一个第一相关项目生成所述项目对比正例,包括:对所述至少一个第一相关项目中的属于同一初始样本的各相关项目进行合并得到所述项目对比正例;和/或,所述基于所述至少一个第三相关项目生成所述项目对比负例,包括:对所述至少一个第三相关项目中的属于同一初始样本的各相关项目进行合并得到所述项目对比负例。
8、在一些实施例中,所述第二对比样本子集包括:所述多个初始样本中的每个初始样本各自对应的多个第二对比样本;从所述序列周期性对比维度对所述多个初始样本中的各初始样本进行样本扩增得到所述第二对比样本子集,包括:针对所述多个初始样本中的第u个初始样本,基于所述第u个初始样本的周期性,对所述第u个初始样本进行扩增得到所述第u个初始样本对应的所述多个第二对比样本,所述u为小于或等于m的正整数,所述m为所述多个初始样本的数量。
9、在一些实施例中,所述第u个初始样本对应的所述多个第二对比样本包括:序列对比正例、序列对比负例、以及序列对比弱正例,其中,所述序列对比正例的周期性与所述第u个初始样本的周期性一致,所述序列对比弱正例的周期性与所述第u个初始样本的周期性不一致,所述序列对比负例不具有周期性。
10、在一些实施例中,所述序列对比正例是通过对所述第u个初始样本中的至少部分项目进行替换得到的,其中,所述替换之前的项目与所述替换之后的项目在特征空间中的距离小于预设距离;所述序列对比负例是通过对所述第u个初始样本中的项目进行随机打乱得到的;以及,所述序列对比弱正例是通过对所述第u个初始样本中每个周期内的部分项目进行合并得到的,或者,通过在所述第u个初始样本中每个周期内插入目标项目得到的。
11、在一些实施例中,所述从所述两个对比维度,对所述多个初始样本和所述对比样本集合进行对比学习,以得到推荐模型,包括:从所述项目相关性对比维度,对所述项目集合和所述第一对比样本子集进行对比得到第一损失;从所述序列周期性对比维度,对所述多个初始样本和所述第二对比样本子集进行对比得到第二损失;基于所述第一损失和所述第二损失,确定总损失;以及,通过优化所述总损失对所述推荐模型的参数进行更新。
12、在一些实施例中,所述第一对比样本子集包括:所述项目集合中的每个项目各自对应的多个第一对比样本;所述从所述项目相关性对比维度,对所述项目集合和所述第一对比样本子集进行对比得到第一损失,包括:针对所述项目集合中的第i个项目,将所述第i个项目对应的所述多个第一对比样本的特征与所述第i个项目的特征进行对比,确定所述第i个项目对应的第一子损失,其中,所述i为小于或等于n的正整数,所述n为所述项目集合中所包含的所述项目的数量,以及,对所述项目集合中的所有项目对应的所述第一子损失进行求和,得到所述第一损失。
13、在一些实施例中,所述第i个项目对应的所述多个第一对比样本包括:项目对比正例、项目对比负例、以及项目对比弱正例;所述确定所述第i个项目对应的第一子损失包括:以最大化所述项目对比正例的特征与所述第i个项目的特征之间的第一相似度、以及最大化所述项目对比弱正例的特征与所述第i个项目的特征之间的第二相似度为目标,并以所述第一相似度大于所本文档来自技高网...
【技术保护点】
1.一种推荐模型的训练方法,其中,所述方法包括:
2.根据权利要求1所述的方法,其中,所述对比样本集合包括第一对比样本子集和第二对比样本子集;
3.根据权利要求2所述的方法,其中,所述第一对比样本子集包括:所述项目集合中的每个项目各自对应的多个第一对比样本;
4.根据权利要求3所述的方法,其中,所述第i个项目对应的所述多个第一对比样本包括:项目对比正例、项目对比负例、以及项目对比弱正例;
5.根据权利要求4所述的方法,其中,
6.根据权利要求4所述的方法,其中,
7.根据权利要求2所述的方法,其中,所述第二对比样本子集包括:所述多个初始样本中的每个初始样本各自对应的多个第二对比样本;
8.根据权利要求7所述的方法,其中,所述第u个初始样本对应的所述多个第二对比样本包括:序列对比正例、序列对比负例、以及序列对比弱正例,其中
9.根据权利要求8所述的方法,其中,
10.根据权利要求2所述的方法,其中,所述从所述两个对比维度,对所述多个初始样本和所述对比样本集合进行对比学习,以得
11.根据权利要求10所述的方法,其中,所述第一对比样本子集包括:所述项目集合中的每个项目各自对应的多个第一对比样本;
12.根据权利要求11所述的方法,其中,所述第i个项目对应的所述多个第一对比样本包括:项目对比正例、项目对比负例、以及项目对比弱正例;
13.根据权利要求10所述的方法,其中,所述第二对比样本子集包括:所述多个初始样本中的每个初始样本各自对应的多个第二对比样本;
14.根据权利要求13所述的方法,其中,所述第u个初始样本对应的所述多个第二对比样本包括:序列对比正例、序列对比负例、以及序列对比弱正例;
15.根据权利要求1所述的方法,其中,在得到所述推荐模型之后,所述方法还包括:
16.一种推荐方法,其中,所述方法包括:
17.一种电子设备,包括:
18.一种电子设备,包括:
...【技术特征摘要】
1.一种推荐模型的训练方法,其中,所述方法包括:
2.根据权利要求1所述的方法,其中,所述对比样本集合包括第一对比样本子集和第二对比样本子集;
3.根据权利要求2所述的方法,其中,所述第一对比样本子集包括:所述项目集合中的每个项目各自对应的多个第一对比样本;
4.根据权利要求3所述的方法,其中,所述第i个项目对应的所述多个第一对比样本包括:项目对比正例、项目对比负例、以及项目对比弱正例;
5.根据权利要求4所述的方法,其中,
6.根据权利要求4所述的方法,其中,
7.根据权利要求2所述的方法,其中,所述第二对比样本子集包括:所述多个初始样本中的每个初始样本各自对应的多个第二对比样本;
8.根据权利要求7所述的方法,其中,所述第u个初始样本对应的所述多个第二对比样本包括:序列对比正例、序列对比负例、以及序列对比弱正例,其中
9.根据权利要求8所述的方法,其中,
10.根据权利要求2所述的方...
【专利技术属性】
技术研发人员:田长鑫,胡斌斌,刘子奇,张志强,周俊,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。