推荐模型生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:35828425 阅读:22 留言:0更新日期:2022-12-03 13:56
本发明专利技术涉及分类模型领域,尤其涉及一种推荐模型生成方法、装置、计算机设备及存储介质。其方法包括:获取数据集;利用标签增强方法对原始标签数据进行标签转化处理,得到标签分布数据;通过初始推荐模型对标签分布数据进行标签预测处理,得到样本数据的预测标签数据;根据原始标签数据、预测标签数据和标签分布数据确定初始推荐模型的总损失函数;根据总损失函数对初始推荐模型进行反向传播模型训练,得到推荐模型。本发明专利技术考虑了用户的打分习惯,通过该标签分布数据得到的预测标签更加接近物品的真实标签,基于该预测标签和原始标签以及标签分布数据对初始推荐模型进行模型训练,提高了推荐模型的输出结果的准确性。了推荐模型的输出结果的准确性。了推荐模型的输出结果的准确性。

【技术实现步骤摘要】
推荐模型生成方法、装置、计算机设备及存储介质


[0001]本专利技术涉及分类模型领域,尤其涉及一种推荐模型生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着人工智能的快速发展,智能推荐模型被广泛应用在各个行业。目前,很多模型基于人工标注的样本数据进行模型训练得到。然而,人工标注的标签往往容易受打标签者的主观因素的影响,而导致与实际标签存在差异,从而影响推荐模型推荐产品的准确性。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种推荐模型生成方法、装置、计算机设备及存储介质,以解决现有技术。
[0004]一种推荐模型生成方法,包括:
[0005]获取数据集;所述数据集包括样本数据和与所述样本数据对应的原始标签数据;
[0006]利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据;
[0007]通过初始推荐模型对所述标签分布数据进行标签预测处理,得到所述样本数据的预测标签数据;
[0008]根据所述原始标签数据、所述预测标签数据和所述标签分布数据确定所述初始推荐模型的总损失函数;
[0009]根据所述总损失函数对所述初始推荐模型进行反向传播模型训练,得到推荐模型。
[0010]一种推荐模型生成装置,包括:
[0011]数据集模块,用于获取数据集;所述数据集包括样本数据和与所述样本数据对应的原始标签数据;
[0012]标签分布数据模块,用于利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据;
[0013]预测标签数据模块,用于通过初始推荐模型对所述标签分布数据进行标签预测处理,得到所述样本数据的预测标签数据;
[0014]总损失函数模块,用于根据所述原始标签数据、所述预测标签数据和所述标签分布数据确定所述初始推荐模型的总损失函数;
[0015]推荐模型模块,用于根据所述总损失函数对所述初始推荐模型进行反向传播模型训练,得到推荐模型。
[0016]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述推荐模型生成方法。
[0017]一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个
或多个处理器执行时,使得所述一个或多个处理器执行如上述推荐模型生成方法。
[0018]上述推荐模型生成方法、装置、计算机设备及存储介质,通过获取数据集;所述数据集包括样本数据和与所述样本数据对应的原始标签数据;利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据;通过初始推荐模型对所述标签分布数据进行标签预测处理,得到所述样本数据的预测标签数据;根据所述原始标签数据、所述预测标签数据和所述标签分布数据确定所述初始推荐模型的总损失函数;根据所述总损失函数对所述初始推荐模型进行反向传播模型训练,得到推荐模型。在本实施例中,利用标签增强方法对原始标签数据进行标签转化处理,得到标签分布数据,由于标签分布数据包含同一用户将同一物品标记为不同标签的概率,考虑了用户的打分习惯,通过该标签分布数据得到的预测标签更加接近物品的真实标签,提高了预测标签的准确性。基于该预测标签和原始标签以及标签分布数据对初始推荐模型进行模型训练,提高了推荐模型的输出结果的准确性。
附图说明
[0019]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本专利技术一实施例中推荐模型生成方法的一应用环境示意图;
[0021]图2是本专利技术一实施例中推荐模型生成方法的一流程示意图;
[0022]图3是本专利技术一实施例中推荐模型生成装置的一结构示意图;
[0023]图4是本专利技术一实施例中计算机设备的一示意图。
具体实施方式
[0024]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0025]本实施例提供的推荐模型生成方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0026]在一实施例中,如图2所示,提供一种推荐模型生成方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
[0027]S10、获取数据集;所述数据集包括样本数据和与所述样本数据对应的原始标签数据。
[0028]可理解的,样本数据是指包含若干样本的数据。其中,样本是指用户物品对。例如,用户A1与物品B1之间存在关联关系,则(A1,B1)为一个用户物品对。一个用户可以与多个物品存在关联关系,则该用户对应有多个用户物品对。例如,用户A1与物品(B1

B10)之间存在
关联关系,则该用户对应有10个用户物品对,分别为(A1,B1),(A1,B2),
……
,(A1,B10)。原始标签数据包含若干原始标签。其中,原始标签是指用户物品对中的用户给物品打的标签。每个用户物品对对应一个原始标签。
[0029]S20、利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据。
[0030]可理解的,由于不同的用户对同一物品进行打标时,受主观因素的影响,打出的标签与物品的实际标签之间存在差异。为了减少这一差异,采用标签增强方法对原始标签数据进行标签转化处理。其中,标签增强方法考虑了用户的打分习惯以及不同用户的打分差异等主观因素,可有效增强标签的准确性。优选的,标签增强方法包括但不限于软聚类算法、高标签传输算法以及拉普拉斯算法。标签转化处理是指通过标签增强方法将原始标签数据中的原始标签转换成不同维度的标签数据的处理过程。标签分布数据包含若干标签概率分布。其中,标签概率分布是指某一用户将某一物品标记为不同标签的概率的分布情况。一个用户物品对对应一个标签概率分布。例如,若物品B1的基础标签有(1、2、3、4),而用户物品对(A1,B1)的原始标签为3,则与用户物品对(A1,B1)对应的标签分布数据可为(0.1、0.2、0.5、0.2),其中“0.1”表示用户A1将物品B1标记为“1”的概率,依次类推,可知,用户A1将物品B1标记为“2”的概率为0.2;用户A1将物品B1标记为“3”的概率为0.5;用户A1将物品B1标记为“4”的概率为0.2。
[0031]S30、通过初始推荐模型对所述标签分布数据进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐模型生成方法,其特征在于,包括:获取数据集;所述数据集包括样本数据和与所述样本数据对应的原始标签数据;利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据;通过初始推荐模型对所述标签分布数据进行标签预测处理,得到所述样本数据的预测标签数据;根据所述原始标签数据、所述预测标签数据和所述标签分布数据确定所述初始推荐模型的总损失函数;根据所述总损失函数对所述初始推荐模型进行反向传播模型训练,得到推荐模型。2.如权利要求1所述的推荐模型生成方法,其特征在于,所述利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据,包括:获取所述样本数据的特征空间;基于所述特征空间,利用高斯分布方法对所述原始标签数据进行归一化的标签转化处理,得到所述标签分布数据。3.如权利要求1所述的推荐模型生成方法,其特征在于,所述利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据,包括:获取所述样本数据的特征空间;基于所述特征空间,利用软聚类算法对所述原始标签数据进行聚类处理,得到聚类数据;对所述聚类数据进行标签转化处理,得到所述标签分布数据。4.如权利要求1所述的推荐模型生成方法,其特征在于,所述利用标签增强方法对所述原始标签数据进行标签转化处理,得到标签分布数据,包括:获取所述样本数据的特征空间;根据所述特征空间计算所述原始标签数据的相似度数据;通过拉普拉斯方法对所述相似度数据进行归一化处理,得到标签分布数据。5.如权利要求4所述的推荐模型生成方法,其特征在于,所述通过拉普拉斯方法对所述相似度数据进行归一化处理,得到标签分布数据,包括:通过所述拉普拉斯方法对所述相似度数据进行归一化和对称处理,得到传播数据;根据所述传播数据确定初始标签分布数据和与所述初始标签分布数据对应的迭代更新方法;基于所述迭代更新方法对所述初始标签分布数据进...

【专利技术属性】
技术研发人员:李泽远王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1