一种基于融合影响力的群体推荐方法、装置制造方法及图纸

技术编号:35143148 阅读:27 留言:0更新日期:2022-10-05 10:19
本发明专利技术提供了一种融合影响力的群体推荐方法、装置,其可以帮助社交、商家平台更精准地推送社交内容、活动项目给群体,提升群体的满意度和粘性,包括步骤:将用户、群体和项目的数据进行向量化表示;将用户和其所在的群体构成正样例,将用户和其所不在的群体构成负样例,依据群体索引表生成的难负例,基于神经网络构建对比学习模型、群体推荐模型、用户推荐模型,构建模型的损失函数;联合三个模型的损失函数构造多任务学习的损失函数,联合训练三个模型,直至模型收敛,获得训练好的各个模型;将群体和各个项目分别输入训练好的群体推荐模型,输出群体对各个项目具有偏好的概率,依据偏好概率得到群体的推荐项目。概率得到群体的推荐项目。概率得到群体的推荐项目。

【技术实现步骤摘要】
一种基于融合影响力的群体推荐方法、装置


[0001]本专利技术属于数据挖掘、信息检索领域,特别涉及一种融合影响力的群体推荐方法、装置。

技术介绍

[0002]互联网上的群体活动丰富多彩,国内从网易云音乐的“云圈”,豆瓣的“小组”再到喜马拉雅的“圈子”,国外从Meetup上一群青少年组织社交活动,Weeplaces上一群驴友商量旅游目的地再到Movielens上一群观影爱好者挑选电影。群体推荐任务旨在建模群体内成员如何达成决定或者共识,推荐能满足大多数成员预期的项目。群体推荐任务相比于个体用户推荐任务,面临着一些全新的挑战:
[0003]群体内决策过程是动态的,因为成员在不同项目上决策时,对其熟悉、偏好程度不同,每个成员权重不是一成不变,影响力需要动态考虑调整;用户在不同群体间有不同影响力,考虑成员在不同群体间的身份权重不同,影响力也不同,带来了决策的复杂性。
[0004]现有研究有基于概率模型,其忽视了群体内部成员和项目的交互行为,只聚焦于群体层面;有基于注意力机制的模型,该类方法忽视了用户在不同群体间的影响力和权重不同;有基于对比学习类的模型,该类方法忽视了群体内的用户在面对不同项目时,其影响力和权重不同;有引入外部知识的模型,诸如社交关系和用户画像,然而该类方法忽视了在现实中外部信息难以获取,落地到工业级的推荐系统有一定距离。
[0005]为此,本专利技术旨在提供一种融合影响力的群体推荐方法来解决目前存在的问题。

技术实现思路

[0006]针对上述问题,本专利技术提供了一种融合影响力的群体推荐方法、装置以及计算机存储介质,其可以帮助社交、商家平台更精准地推送社交内容、活动项目给群体,提升群体的满意度和粘性。
[0007]其技术方案是这样的:一种融合影响力的群体推荐方法,其特征在于,包括以下步骤:
[0008]将用户、用户所在的群体和可供选择的项目的数据进行向量化表示;
[0009]将用户和其所在的群体构成正样例,将用户和其所不在的群体构成负样例,所述负样例中还包括依据群体索引表生成的难负例,所述群体索引表依据原始的用户、用户所在的群体和可供选择的项目的数据构建;
[0010]基于神经网络构建对比学习模型,所述对比学习模型用于区分正、负样例,构建对比学习模型的损失函数;
[0011]基于神经网络构建群体推荐模型,将群体以及项目输入所述群体推荐模型,输出群体偏好对应项目的概率,基于成对学习策略构建群体推荐模型的损失函数;
[0012]基于神经网络构建用户推荐模型,将用户以及项目输入所述用户推荐模型,输出用户偏好对应项目的概率,基于成对学习策略构建用户推荐模型的损失函数;
[0013]联合对比学习模型、用户推荐模型、群体推荐模型的损失函数构造多任务学习的损失函数,通过所述多任务学习的损失函数联合训练所述对比学习模型、用户推荐模型、群体推荐模型,直至模型收敛,获得训练好的各个模型;
[0014]将群体和各个项目分别输入训练好的群体推荐模型,输出群体对各个项目具有偏好的概率,依据群体对各个项目具有偏好的概率,输出群体的推荐项目。
[0015]进一步的,所述群体索引表包括第一群体索引表和第二群体索引表,所述第一张群体索引表用于记录有成员交集的群体序号,所述第二张群体索引表用于记录相同项目交集的其他群体序号。
[0016]进一步的,将原始的用户、用户所在的群体和可供选择的项目的数据采用one

hot编码进行数字化表示;
[0017]通过预训练的权重矩阵将用户、群体和项目的编码数据进行向量化表示。
[0018]进一步的,将原始的用户、用户所在的群体和可供选择的项目的数据分别以用户集合群体集合和项目集合进行表示,采用Glorot函数初始化的权重矩阵,表示为:
[0019][0020]其中和分别是对应用户、群体和项目特征的权重参数,表示用户、群体和项目的数量,为正态分布,k表示嵌入的维度。
[0021]基于权重矩阵,利用用户、群体和项目的one

hot编码在权重矩阵中索引得到对应的向量表示,表示为:
[0022][0023]其中,u、g、v分别为用户、群体和项目的相邻表示,u
one

hot
、g
one

hot
、v
one

hot
为用户、群体和项目的one

hot编码表示。
[0024]进一步的,将用户u
i
和其所在的群体g
i
构建为正样例(u
i
,g
i
),负样例的构建包括以下步骤:
[0025]依次判断群体g
i
在第一群体张索引表、第二群体张索引表内有无对应的群体,若存在则从对应的群体索引表中随机取一个群体赋值为得到满足负难例条件的负样例
[0026]若群体g
i
在第一群体张索引表、第二群体张索引表内无对应的群体,则随机从其他群体中取一个群体序号赋值为得到常规的负样例
[0027]对于包含正样例(u
i
,g
i
)和负样例的样本集合,基于神经网络构建对比学习模型,所述对比学习模型用于区分正样例(u
i
,g
i
)和负样例采用margin triplet loss损失函数构建对比学习模型的损失函数,表示为:
[0028][0029]其中,为对比学习模型的损失函数,∈为控制正、负样例之间的距离的边界值,为群体的数量,|g
i
|表示第i个群体的大小,u
j
表示群体g
i
下第j个成员。
[0030]进一步的,所述群体推荐模型包括attention层和aggregate层、池化层和全连接层,
[0031]在attention层中,建模群体内成员在项目下影响力的不同,定义为:
[0032][0033]其中u
i
表示了群里中成员i的历史偏好,v
k
表示项目k的特征向量,表示在给定项目v
k
背景下,用户u
i
相较于用户u
j
的偏好差异,若u
i
更熟悉v
k
,则值大,表示u
i
有更大权重,影响力更大;
[0034]聚合群体内成员u
i
相较于群体里内其他成员的偏好差异,表示为:
[0035][0036]其中表示群体的成员数目;
[0037]群体内所有成员聚合后的偏好差异表示为:
[0038][0039]其中[

]表示拼接各个向量;
[0040]采用激活函数Relu做非线性变化得到捕捉群体内成员非线性关系的向量h2,表示为:
[0041]h2=Relu本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合影响力的群体推荐方法,其特征在于,包括以下步骤:将用户、用户所在的群体和可供选择的项目的数据进行向量化表示;将用户和其所在的群体构成正样例,将用户和其所不在的群体构成负样例,所述负样例中还包括依据群体索引表生成的难负例,所述群体索引表依据原始的用户、用户所在的群体和可供选择的项目的数据构建;基于神经网络构建对比学习模型,所述对比学习模型用于区分正、负样例,构建对比学习模型的损失函数;基于神经网络构建群体推荐模型,将群体以及项目输入所述群体推荐模型,输出群体偏好对应项目的概率,基于成对学习策略构建群体推荐模型的损失函数;基于神经网络构建用户推荐模型,将用户以及项目输入所述用户推荐模型,输出用户偏好对应项目的概率,基于成对学习策略构建用户推荐模型的损失函数;联合对比学习模型、用户推荐模型、群体推荐模型的损失函数构造多任务学习的损失函数,通过所述多任务学习的损失函数联合训练所述对比学习模型、用户推荐模型、群体推荐模型,直至模型收敛,获得训练好的各个模型;将群体和各个项目分别输入训练好的群体推荐模型,输出群体对各个项目具有偏好的概率,依据群体对各个项目具有偏好的概率,输出群体的推荐项目。2.根据权利要求1所述的一种融合影响力的群体推荐方法,其特征在于:所述群体索引表包括第一群体索引表和第二群体索引表,所述第一张群体索引表用于记录有成员交集的群体序号,所述第二张群体索引表用于记录相同项目交集的其他群体序号。3.根据权利要求1所述的一种融合影响力的群体推荐方法,其特征在于:将原始的用户、用户所在的群体和可供选择的项目的数据采用one

hot编码进行数字化表示;通过预训练的权重矩阵将用户、群体和项目的编码数据进行向量化表示。4.根据权利要求3所述的一种融合影响力的群体推荐方法,其特征在于:将原始的用户、用户所在的群体和可供选择的项目的数据分别以用户集合群体集合和项目集合进行表示,采用Glorot函数初始化的权重矩阵,表示为:其中和分别是对应用户、群体和项目特征的权重参数,表示用户、群体和项目的数量,为正态分布,k表示嵌入的维度;基于权重矩阵,利用用户、群体和项目的one

hot编码在权重矩阵中索引得到对应的向量表示,表示为:其中,u、g、v分别为用户、群体和项目的相邻表示,u
one

hot
、g
one

hot
、v
one

hot
为用户、群体和项目的one

hot编码表示。5.根据权利要求4所述的一种融合影响力的群体推荐方法,其特征在于:将用户u
i
和其所在的群体g
i
构建为正样例(u
i
,g
i
),负样例的构建包括以下步骤:
依次判断群体g
i
在第一群体张索引表、第二群体张索引表内有无对应的群体,若存在则从对应的群体索引表中随机取一个群体赋值为得到满足负难例条件的负样例若群体g
i
在第一群体张索引表、第二群体张索引表内无对应的群体,则随机从其他群体中取一个群体序号赋值为得到常规的负样例对于包含正样例(u
i
,g
i
)和负样例的样本集合,基于神经网络构建对比学习模型,所述对比学习模型用于区分正样例(u
i
,g
i
)和负样例采用margin triplet loss损失函数构建对比学习模型的损失函数,表示为:其中,为对比学习模型的损失函数,∈为控制正、负样例之间的距离的边界值,为群体的数量,|g
i
|表示第i个群体的大小,u
j
表示群体g
i
下第j个成员。6.根据权利要求5所述的一种融合影响力的群体推荐方法,其特征在于:所述群体推荐模型包括attention层和aggregate层、池化层和全连接层,在attention层中,建模群体内成员在项目下影响力的不同,定义为:其中u
i
表示了群里中成员i的历史偏好,v
k
表示项目k的特征向量,表示在给定项目v
k
背景下,用户u
i
相较于用户u
j
的偏好差异,若u
i
更熟悉v
k
,则值大,表示u
i
有更大权重,影响力更大;聚合群体内成员u
i
相较于群体里内其他成员的偏好差异,表示为:其中表示群体的成员数目;群体内所有成员聚合后的偏好差异表示为:其中[

]表示拼接各个向量;采用激活函数...

【专利技术属性】
技术研发人员:庄洪武周斌李爱平王晔涂宏魁江荣高立群汪海洋宋鑫刘宇嘉曾康王宸铭杨斌石铭洲陈跃飞张晨晖
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1