【技术实现步骤摘要】
用于生成相关度确定模型的方法和装置
本公开的实施例涉及计算机
,具体涉及用于生成相关度确定模型的方法和装置。
技术介绍
两个信息之间的相关度通常是很难确定的。现有的一种方法是分别提取能够用于表征这两个信息的特征向量,然后计算两个特征向量之间的相似度,并使用得到的相似度来表征这两个信息之间的相关度。
技术实现思路
本公开的实施例提出了用于生成相关度确定模型的方法和装置。第一方面,本公开的实施例提供了一种用于生成相关度确定模型的方法,该方法包括:获取训练样本集,其中,训练样本集中的训练样本包括信息对和信息对中的信息之间的相关度,其中,信息对对应的相关度通过如下步骤确定:获取信息对对应的相同用户数,以及根据信息对对应的相同用户数,确定信息对中的信息之间的相关度,其中,信息对对应的相同用户数用于表示对信息对中的两个信息分别执行过预设操作集中的预设操作的用户的数目;利用机器学习的方法,基于训练样本集和预设的损失函数,训练得到相关度确定模型,其中,相关度确定模型用于表征信息对与信息对中的信息之间的相关度 ...
【技术保护点】
1.一种用于生成相关度确定模型的方法,包括:/n获取训练样本集,其中,所述训练样本集中的训练样本包括信息对和信息对中的信息之间的相关度,其中,信息对对应的相关度通过如下步骤确定:获取信息对对应的相同用户数,以及根据信息对对应的相同用户数,确定信息对中的信息之间的相关度,其中,信息对对应的相同用户数用于表示对信息对中的两个信息分别执行过预设操作集中的预设操作的用户的数目;/n利用机器学习的方法,基于所述训练样本集和预设的损失函数,训练得到相关度确定模型,其中,相关度确定模型用于表征信息对与信息对中的信息之间的相关度的对应关系。/n
【技术特征摘要】
1.一种用于生成相关度确定模型的方法,包括:
获取训练样本集,其中,所述训练样本集中的训练样本包括信息对和信息对中的信息之间的相关度,其中,信息对对应的相关度通过如下步骤确定:获取信息对对应的相同用户数,以及根据信息对对应的相同用户数,确定信息对中的信息之间的相关度,其中,信息对对应的相同用户数用于表示对信息对中的两个信息分别执行过预设操作集中的预设操作的用户的数目;
利用机器学习的方法,基于所述训练样本集和预设的损失函数,训练得到相关度确定模型,其中,相关度确定模型用于表征信息对与信息对中的信息之间的相关度的对应关系。
2.根据权利要求1所述的方法,其中,所述利用机器学习的方法,基于所述训练样本集和预设的损失函数,训练得到相关度确定模型,包括:
从所述训练样本集中选取两个训练样本分别作为第一训练样本和第二训练样本,以及执行如下训练步骤:将第一训练样本中的信息对输入至初始模型,得到第一训练样本对应的第一相关度,以及将第二训练样本中的信息对输入至初始模型,得到第二训练样本对应的第二相关度;基于得到的第一相关度、第二相关度、第一训练样本中的相关度、第二训练样本中的相关度,确定损失函数的值;响应于根据损失函数的值确定初始模型训练完成,将初始模型确定为相关度确定模型。
3.根据权利要求2所述的方法,其中,所述训练步骤还包括:
响应于确定根据损失函数的值确定初始模型未训练完成,调整初始模型的参数,以及从所述训练样本集中重新选取两个训练样本分别作为第一训练样本和第二训练样本,使用调整后的初始模型作为初始模型,继续执行所述训练步骤。
4.根据权利要求2所述的方法,其中,所述基于得到的第一相关度、第二相关度、第一训练样本中的相关度、第二训练样本中的相关度,确定损失函数的值,包括:
确定第一相关度与第一训练样本中的相关度的差值作为第一差值;
确定第二相关度与第二训练样本中的相关度的差值作为第二差值;
根据所述第一差值和所述第二差值,确定损失函数的值。
5.根据权利要求1所述的方法,其中,所述训练样本集中的训练样本包括的信息对对应的相关度与对应的相同用户数正相关。
6.根据权利要求1-5之一所述的方法,其中,信息对对应的相同用户数用于表示对信息对中的两个信息分别执行过预设操作集中的同一预设操作的用户的数目。
7.一种用于生成相关度确定模型的装置,包括:
训练样本集获取单元,被配置成获取训练样本集,其中,所述训练样本集中的训练样本包括信息对和信息对中的信息之间的相关度,其中,信息对对应的相关度通过如下步骤确定:获取信息对对应的相同用户数,以及根据信息对对应的相同用户数,确定信息对中的信息之间的相关度,其中,信息对对应的相同用户数用于表示对信息对中的两个信息分别执行过预设操作集中的预设操作的用户的数目,信息对对应的相关度与对应的相同用户数正相关;
训练单元,被配置成利用机器学习的方法,基于所述训练样本集和预设的损失函数,训练得到相关度确定模型,其中,相关度确定模型用于表征信息对与信息对中的信息之间的相关度的对应关系。
8.根据权利要求7所述的装置,其中,所述训练单...
【专利技术属性】
技术研发人员:严林,乔木,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。