一种基于图卷积网络的反事实项目推荐方法技术

技术编号:32460612 阅读:23 留言:0更新日期:2022-02-26 08:48
本发明专利技术公开了一种基于图卷积网络的反事实项目推荐方法,本发明专利技术通过对图卷积网络GCN引入满意度,且满意度与项目曝光特征、项目内容特征、用户项目曝光特征偏好和项目内容特征偏好均有关,使得本发明专利技术提出的方法充分考虑了数据间的因果关系,从而达到通过本方法生成的项目推荐列表更符合用户期望,大大减少“点击欺骗”的概率;本发明专利技术解决了传统的推荐方法得到的推荐列表与用户期望存在较大差距的问题。到的推荐列表与用户期望存在较大差距的问题。到的推荐列表与用户期望存在较大差距的问题。

【技术实现步骤摘要】
一种基于图卷积网络的反事实项目推荐方法


[0001]本专利技术涉及互联网领域,具体涉及一种基于图卷积网络的反事实项目推荐方法。

技术介绍

[0002]传统的推荐方法大多数基于历史行为数据利用机器学习算法构建用户偏好预测模型,并制定推荐列表。但是,一方面机器学习依赖的相关性并不能代表因果性,导致现存模型缺少因果可解释性,另一方面,推荐列表与用户满意度之间是存在巨大差距的。通常情况下,用户会被有吸引力的标题/封面“欺骗”而点击某个项目,即存在“点击欺骗”问题。目前,神经网络传播模型作为目前解决“点击欺骗”问题最常用的技术,例如,通过将双向长短期记忆网络(LSTM)与注意力和文本和图像上的神经网络结合在一起来创建预测模型,但同类方法仅仅是使用卷积神经网络计算了文字的字符级表示,并没有反映数据间的因果关系。同时,避免“点击欺骗”的推荐方法都较少地关注表征数据背后的因果关系。通过研究在数据中存在关联关系的前提下,表示出数据之间的因果关系,从而提高推荐列表的真实有效性,进行高质量的推荐是具有现实意义的。

技术实现思路

[0003]针对现有技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图卷积网络的反事实项目推荐方法,其特征在于,包括以下步骤:S1、采集并预处理点击欺骗的新闻推荐数据和商品推荐数据;S2、对预处理后的点击欺骗的新闻推荐数据和商品推荐数据进行特征提取,得到特征数据;S3、对特征数据进行分类,得到分类特征;S4、提取分类特征中的视频和图片,并采用卷积神经网络将视频和图片数据转换为视觉特征向量;S5、采用预训练语言表征模型Bert提取分类特征中的文本特征向量;S6、根据视觉特征向量和文本特征向量,得到项目曝光特征向量和项目内容特征向量;S7、根据项目曝光特征向量和项目内容特征向量,采用图卷积网络GCN计算用户项目评分;S8、根据用户项目评分,对卷积神经网络和图卷积网络GCN进行联合训练,得到训练完成的卷积神经网络和图卷积网络GCN;S9、根据训练完成的卷积神经网络和图卷积网络GCN,生成排序的项目推荐列表。2.根据权利要求1所述的基于图卷积网络的反事实项目推荐方法,其特征在于,所述步骤S3中特征数据包括:项目特征I;步骤S3中将项目特征I分为:项目曝光特征h、项目内容特征c和静态特征λ;所述项目曝光特征h分为:曝光的视频(h,I
video
)、封面图片(h,I
fig
)和封面标题(h,I
char
);所述项目内容特征c分为:项目内容的视频(c,I
video
)、内容图片(c,I
fig
)和内容文字(c,I
char
);所述静态特征分为λ:项目静态特征λ
i
;所述曝光的视频(h,I
video
)、封面图片(h,I
fig
)、曝光的视频(h,I
video
)和封面图片(h,I
fig
)属于视觉特征;所述封面标题(h,I
char
)和内容文字(c,I
char
)属于文本特征。3.根据权利要求2所述的基于图卷积网络的反事实项目推荐方法,其特征在于,所述步骤S4包括以下分步骤:S41、提取项目曝光特征h和项目内容特征c中的视频和图片,得到表征视觉特征的图像数据;S42、对图像数据进行二值化处理,得到像素矩阵;S43、对像素矩阵进行卷积操作,得到特征图;S44、对特征图池化处理,得到降低数据量后的特征图;S45、采用全连接层将降低数据量后的特征图切割成一维向量,得到视觉特征向量。4.根据权利要求3所述的基于图卷积网络的反事实项目推荐方法,其特征在于,所述步骤S43中特征图的大小表达公式为:其中,R
*
为特征图的大小,R为像素矩阵的大小,q为补零层数,k为卷积核大小,p为移动
步幅。5.根据权利要求3所述的基于图卷积网络的反事实项目推荐方法,其特征在于,所述步骤S45中采用全连接层将降低数据量后的特征图切割成一维向量的公式为:χ
h

view
=relu(W*Γ+b)其中,χ
h

view
为一维的视觉特征向量,relu()为激活函数,W为全连接层的权重,b为全连接层的偏置,Γ为降低数据量后的特征图。6.根据权利要求5所述的基于图卷积网络的反事实项目推荐方法,其特征在于,所述步骤S6包括以下分步骤:S61、将视觉特征向量和文本特征向量拼接到项目曝光特征h字符串和项目内容特征c字符串,得到初步项目曝光特征向量和初步项目内容特征向量;S62、采用项目静态特征λ
i
分别对初步项目曝光特征向量和初步项目内容特征向量进行再次拼接,得到最终的项目曝光特征向量和项目内容特征向量。7.根据权利要求6所述的基于图卷积网络的反事实项目推荐方法,其特征在于,所述步骤S61中将视觉特征向量和文本特征向量进行拼接的公式为:χ
h
=[χ
h

view
,χ
h

char

c
=[χ
c

view
,χ
c
‑...

【专利技术属性】
技术研发人员:王庆先黄庆常奥刘鹏宇曾昌强吴苏强
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1