基于生成模型的隐私保护跨域推荐方法技术

技术编号:38338683 阅读:9 留言:0更新日期:2023-08-02 09:19
本申请提供基于生成模型的隐私保护跨域推荐方法,其中所述基于生成模型的隐私保护跨域推荐方法包括:获取源域预测数据和目标域训练数据,其中,所述源域预测数据通过将噪声数据输入生成模型生成得到;提取所述源域预测数据的特征向量,获得源域用户信息向量;提取所述目标域训练数据的特征向量,获得目标域用户信息向量和目标域项目信息向量;基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,训练推荐模型;通过生成模型获得的源域预测数据,并不会直接触及到源域中用户的原始信息,实现了对源域用户数据的隐私保护,又将源域的用户知识转移到目标域中,以提高目标域中推荐模型的推荐性能。推荐模型的推荐性能。推荐模型的推荐性能。

【技术实现步骤摘要】
基于生成模型的隐私保护跨域推荐方法


[0001]本申请涉及计算机
,特别涉及基于生成模型的隐私保护跨域推荐方法。本申请同时涉及项目推荐方法,基于生成模型的隐私保护跨域推荐装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着互联网的飞速发展,互联网中的数据信息呈现爆发式增长,面对海量的数据信息,用户很难从众多选择中挑选出自己感兴趣的项目。为了改善用户的体验,推荐系统被广泛应用于不同的场景,如在线购物、音乐推荐、电影推荐等。
[0003]跨域推荐的任务,一般是指在两个数据域中用户的构成有重叠,这样,不同的数据域之间就有了一定量的用户数据。目前的跨域推荐一般是利用跨域推荐模型实现的,目标域可以获得源域的用户数据,然后利用获得的源域的用户数据和目标域本地的用户数据,训练跨域推荐模型,这样训练出来的模型可以实现跨域推荐。然而,当前的跨域推荐模型训练中,用户数据都是显示交互的,严重影响用户数据的隐私。

技术实现思路

[0004]有鉴于此,本申请实施例提供了基于生成模型的隐私保护跨域推荐方法。本申请同时涉及项目推荐方法,基于生成模型的隐私保护跨域推荐装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的用户跨域推荐项目带来的用户隐私数据泄露问题。
[0005]根据本申请实施例的第一方面,提供了一种基于生成模型的隐私保护跨域推荐方法,包括:获取源域预测数据和目标域训练数据,其中,所述源域预测数据通过将噪声数据输入生成模型生成得到;提取所述源域预测数据的特征向量,获得源域用户信息向量;提取所述目标域训练数据的特征向量,获得目标域用户信息向量和目标域项目信息向量;基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,训练推荐模型。
[0006]根据本申请实施例的第二方面,提供了一种项目推荐方法,包括:获取目标用户的用户信息;将所述用户信息输入推荐模型,得到针对所述目标用户的项目推荐信息,其中,所述推荐模型为利用如上述的推荐模型训练的方法训练得到。
[0007]根据本申请实施例的第三方面,提供了一种基于生成模型的隐私保护跨域推荐装置,包括:训练数据获取模块,被配置为获取源域预测数据和目标域训练数据,其中,所述源
域预测数据基于噪声数据通过生成模型获得;第一特征向量提取模块,被配置为提取所述源域预测数据的特征向量,获得源域用户信息向量;第二特征向量提取模块,被配置为提取所述目标域训练数据的特征向量,获得目标域用户信息向量和目标域项目信息向量;模型训练模块,被配置为基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,训练推荐模型。
[0008]根据本申请实施例的第三方面,提供了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述计算机指令时实现所述基于生成模型的隐私保护跨域推荐方法的步骤。
[0009]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机指令,该计算机指令被处理器执行时实现所述基于生成模型的隐私保护跨域推荐方法的步骤。
[0010]本申请提供的基于生成模型的隐私保护跨域推荐方法,获取源域预测数据和目标域训练数据,其中,所述源域预测数据通过将噪声数据输入生成模型生成得到;提取所述源域预测数据的特征向量,获得源域用户信息向量;提取所述目标域训练数据的特征向量,获得目标域用户信息向量和目标域项目信息向量;基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,训练推荐模型。
[0011]本申请一实施例,通过获取生成模型根据噪声数据生成的源域预测数据,以及获取目标域训练数据,并提取源域预测数据中的源域用户信息向量,提取目标域训练数据中的目标域用户信息向量和目标域项目信息向量,以便于根据源域用户信息向量和目标域用户信息向量之间的跨域信息向量、以及目标域项目信息向量,在目标域中训练推荐模型;该种方式通过生成模型获得的源域预测数据,并不会直接触及到源域中用户的原始信息,实现了对源域用户数据的隐私保护;另外,训练推荐模型的输入数据还包括跨域信息向量,将源域的用户知识转移到目标域中,以提高目标域中推荐模型的推荐性能。
附图说明
[0012]图1是本申请一实施例提供的一种基于生成模型的隐私保护跨域推荐方法的结构示意图;图2是本申请一实施例提供的一种基于生成模型的隐私保护跨域推荐方法的流程图;图3是本申请一实施例提供的一种基于生成模型的隐私保护跨域推荐方法的处理流程图;图4是本申请一实施例提供的一种项目推荐方法的流程图;图5是本申请一实施例提供的一种基于生成模型的隐私保护跨域推荐装置的结构示意图;图6是本申请一实施例提供的一种计算设备的结构框图。
具体实施方式
[0013]在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0014]在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0015]应当理解,尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0016]此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
[0017]首先,对本申请一个或多个实施例涉及的名词术语进行解释。
[0018]差分隐私:差分隐私可以为数据集中的单个数据提供较强的隐私保护。
[0019]隐私保护跨域推荐旨在对源域数据进行隐私保护,然后将源域加密的知识用于辅助目标域来提升推荐性能的任务。在隐私保护意识愈发强烈的社会中,解决这个问题对推荐系统的长期发展尤为重要。
[0020]目前,跨域推荐任务,即利用源域数据中的知识辅助目标域的推荐任务,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成模型的隐私保护跨域推荐方法,其特征在于,包括:获取源域预测数据和目标域训练数据,其中,所述源域预测数据通过将噪声数据输入生成模型生成得到;提取所述源域预测数据的特征向量,获得源域用户信息向量;提取所述目标域训练数据的特征向量,获得目标域用户信息向量和目标域项目信息向量;基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,训练推荐模型。2.根据权利要求1所述的方法,其特征在于,所述获取源域预测数据之前,还包括:获取原始数据,其中,所述原始数据包括用户信息、项目信息、所述用户信息与所述项目信息之间的关联信息;随机采样与所述原始数据的结构相关联的噪声数据;将所述噪声数据输入待训练生成模型中,获得所述噪声数据对应的预测数据,其中,所述预测数据包括用户信息向量;基于所述原始数据和所述预测数据计算相似度,根据所述相似度调整所述待训练生成模型中的参数,获得生成模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述原始数据和所述预测数据计算相似度,根据所述相似度调整所述待训练生成模型中的参数,获得生成模型,包括:对所述原始数据进行加噪处理,获得加噪原始样本;计算所述加噪原始样本与所述预测数据的相似度,根据所述相似度调整所述待训练生成模型中的参数,获得生成模型。4.根据权利要求1所述的方法,其特征在于,所述提取所述源域预测数据的特征向量,获得源域用户信息向量,包括:提取所述源域预测数据的特征向量;对所述特征向量进行编码,获得所述特征向量的隐层表征,并将所述隐层表征确定为源域用户信息向量。5.根据权利要求1所述的方法,其特征在于,所述基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,训练推荐模型,包括:基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,确定目标损失值;基于所述目标损失值,训练推荐模型。6.根据权利要求5所述的方法,其特征在于,所述基于所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量、以及所述目标域项目信息向量,确定目标损失值,包括:确定所述源域用户信息向量和所述目标域用户信息向量之间的跨域信息向量;基于所述跨域信息向量,确定跨域损失值;基于所述跨域信...

【专利技术属性】
技术研发人员:陈超超廖馨婷郑小林
申请(专利权)人:杭州金智塔科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1