一种基于对抗训练的流行度去偏方法技术

技术编号:38751093 阅读:11 留言:0更新日期:2023-09-09 11:17
本发明专利技术提出了一种基于对抗训练的流行度去偏方法,涉及推荐系统领域。根据推荐系统点击曝光数据,得到用户的数据特征,然后利用双塔模型训练基础分类器,然后在通过生成对抗网络训练,从实际的用户点击的真实流行

【技术实现步骤摘要】
一种基于对抗训练的流行度去偏方法


[0001]本专利技术涉及推荐系统领域,具体而言,涉及一种基于对抗训练的流行度去偏方法。

技术介绍

[0002]推荐系统中通常存在流行度偏差,在电商、短视频等推荐场景下,将近20%的商品占据80%的点击。流行度偏差问题本质上是由模型训练时样本不均衡的分布所造成,模型在训练过程中学到了更多流行商品的信息,对长尾商品信息获取过少,导致马太效应愈专利技术显。
[0003]目前已有的流行度去偏方法主要包括利用逆权重分数进行加权和分解嵌入表示。然而,这些流行度去偏方法存在一定的缺陷:这些方法未能在造成问题的根源即样本分布进行解决,而是在最终预测时通过加权调整来实现流行度去偏。

技术实现思路

[0004]本专利技术的目的在于提供一种基于对抗训练的流行度去偏方法,其能够利用双塔模型对现有点击曝光数据训练基础分类器,通过生成器和判别器进行交替博弈训练,最小化对抗网络模型的交叉熵损失函数,使得模型可以利用真实流行

真实长尾样本对生成逼近真实的真实流行

虚拟长尾样本对,从而扩充长尾正样本的数量;然后使用对抗学习结果结合基础分类器对虚拟长尾样本进行预测,保留top N商品作为模型训练优质样本的补充,经过模型再训练能够从根本上去除流行度偏差。
[0005]本专利技术的实施例是这样实现的:
[0006]本申请实施例提供一种基于对抗训练的流行度去偏方法,其包括以下步骤:S1:基于实际用户点击特征、物料特征及负采样的样本,采用双塔模型进行训练,形成基础分类器并得到多维物料表征向量{itememb
n
}以及对应物料id表征向量{itemid
n
}。S2:根据t日内用户对商品的点击量占比从高到低进行排序,将累计点击量占比大于K%的商品记为为流行商品,其余商品记为长尾商品。S3:获取t日内用户点击过流行商品i和长尾商品j的物料id,形成真实流行

长尾对(itemid
i
,itemid
j
),并将其转化为表征向量如下:realvec=concat(itememb
i
,itememb
j
)。S4:构建生成器,生成随机向量其中得到虚拟流行

长尾对表征向量如下:fakevec=concat(itememb
i
,randvec
r
)。S5:构建判别器,真实流行

长尾对为1,虚拟流行

长尾对为0,进行参数梯度更新,使判别器能够判别表征向量为真实或虚拟。S6:对生成器进行参数梯度更新,使判别器将生成器生成的虚拟表征向量视为真实表征向量。S7:重复步骤S5和S6以满足预设条件,使生成器生成的虚拟表征向量接近真实表征向量。S8:利用生成器及用户点击过的流行商品生成M个虚拟长尾商品表征向量fakevec
l
,计算虚拟长尾商品表征向量最相似的物料表征向量itememb
l
,生成M个用户对物料id为itemid
l
的长尾点击样本。S9:利用基础分类器对itememb
l
进行预测,按预设方法取预测概率中的部分样本进行保留并作为补充样本。S10:将补充样本添加到原有样本中重新训练双塔模型。
[0007]在本专利技术的一些实施例中,上述步骤S1还包括将对应物料id表征向量{itemid
n
}存储于hive数据库。
[0008]在本专利技术的一些实施例中,上述判别器的损失函数是:
[0009][0010]其中σ(
·
)为sigmoid函数,F(
·
)为将向量映射成标量的函数。
[0011]在本专利技术的一些实施例中,上述生成器的损失函数是:
[0012][0013]其中σ(
·
)为sigmoid函数,F(
·
)为将向量映射成标量的函数。
[0014]在本专利技术的一些实施例中,上述预设条件为:
[0015][0016]其中σ(
·
)为sigmoid函数,F(
·
)为将向量映射成标量的函数。
[0017]在本专利技术的一些实施例中,上述物料表征向量itememb
l
的计算公式是:
[0018][0019]在本专利技术的一些实施例中,上述预设方法为:
[0020]按顺序选取预测结果中排名最高的前N个样本,且M远大于N。
[0021]相对于现有技术,本专利技术的实施例至少具有如下优点或有益效果:
[0022]根据现有推荐系统的点击曝光数据,利用双塔模型训练基础分类器,获取真实流行

真实长尾对,构建判别器和生成器,通过生成对抗网络训练从真实流行

真实长尾商品对得到真实流行

虚拟长尾商品对,并且通过判别器和生成器的损失函数进行参数梯度更新,使生成的虚拟长尾样本逼近真实长尾样本。利用真实流行

真实长尾样本对通过生成对抗学习来生成真实流行

虚拟长尾样本对的方式,能够有效学习真实流行

长尾对的信息,从而生成极为逼近真实的虚拟样本。利用对抗学习结合基础分类器的方式对生成的虚拟样本进行预测,保留top N商品作为模型训练优质样本的补充,避免模型过度学习流行样本,通过生成优质长尾物料点击样本,从根本上平衡流行与长尾物料样本量,使得模型能够更好地学习长尾物料信息,从而准确地预测用户偏好。
附图说明
[0023]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0024]图1为本专利技术中一实施例的流程图;
[0025]图2为本专利技术中一实施例的训练示意图。
具体实施方式
[0026]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
[0027]因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0028]下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
[0029]实施例
[0030本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于对抗训练的流行度去偏方法,其特征在于,包括以下步骤:S1:基于实际用户点击特征、物料特征及负采样的样本,采用双塔模型进行训练,形成基础分类器并得到多维物料表征向量{itememb
n
}以及对应物料id表征向量{itemid
n
};S2:根据t日内用户对商品的点击量占比从高到低进行排序,将累计点击量占比大于K%的商品记为为流行商品,其余商品记为长尾商品;S3:获取t日内用户点击过流行商品i和长尾商品j的物料id,形成真实流行

长尾对(itemid
i
,itemid
j
),并将其转化为表征向量如下:realvec=concat(itememb
i
,itememb
j
);S4:构建生成器,生成随机向量其中得到虚拟流行

长尾对表征向量如下:fakevec=concat(itememb
i
,randvec
r
);S5:构建判别器,真实流行

长尾对为1,虚拟流行

长尾对为0,进行参数梯度更新,使判别器能够判别表征向量为真实或虚拟;S6:对生成器进行参数梯度更新,使判别器将生成器生成的虚拟表征向量视为真实表征向量;S7:重复步骤S5和S6以满足预设条件,使生成器生成的虚拟表征向量接近真实表征向量;S8:利用生成器及用户点击过的流行商品生成M个虚拟长尾商品表征向量fakevec
l
,计算虚拟长尾商品表征...

【专利技术属性】
技术研发人员:张丽娜傅剑文韩弘炀
申请(专利权)人:天翼电子商务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1