向量生成方法、信息推荐方法、装置、设备及介质制造方法及图纸

技术编号:38419693 阅读:18 留言:0更新日期:2023-08-07 11:21
本公开提供向量生成方法、信息推荐方法、装置、设备及介质。包括:获取样本数据集;基于行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理,得到每一信息数据至少融合用户数据后的第一嵌入向量,以及每一用户数据至少融合信息数据后的第二嵌入向量;对每一信息数据的第一嵌入向量进行处理,得到每一信息数据对应的信息向量;对每一用户数据的第二嵌入向量进行处理,得到每一用户数据对应的用户向量;基于每一信息数据对应的信息向量,以及每一用户数据对应的用户向量,对每一信息数据的信息向量进行更新。通过该方法能获得更优的更新后的信息向量,从而提升信息推荐的准确度。升信息推荐的准确度。升信息推荐的准确度。

【技术实现步骤摘要】
向量生成方法、信息推荐方法、装置、设备及介质


[0001]本公开涉及但不限于人工智能
,尤其涉及一种向量生成方法、信息推荐方法、装置、设备及介质。

技术介绍

[0002]在当前信息量急速膨胀的互联网时代,每一个用户都面向了海量的数据,推荐系统可以从海量的数据信息中快速推荐出符合用户特点的数据。
[0003]在推荐场景中大量使用独热(one

hot)编码对样本的特征进行编码,导致样本的特征维度很高但却非常稀疏。深度学习的结构特点却不擅长处理稀疏的特征向量,所以几乎所有的深度学习模型都需要Embedding(“向量化”或者“向量映射”)层作为第一层来将高维稀疏的特征映射到一个相对低维的且稠密的向量上来以便于上层深度神经网络处理。经过Embedding层得到的embedding本身就是极其重要的特征向量,推荐系统算法模型时,embedding是重要的一个步骤,有的推荐算法模型其实就是在做embedding的过程,可见embedding在推荐系统中的重要性。

技术实现思路

[0004]本公开实施例提供一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种向量生成方法,其特征在于,所述方法包括:获取样本数据集;其中,所述样本数据集中每个样本数据包括用户数据、信息数据、以及用户对所行为的信息数据的行为类型标签;基于所述行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理,得到每一信息数据至少融合用户数据后的第一嵌入向量,以及每一用户数据至少融合信息数据后的第二嵌入向量;对每一信息数据的第一嵌入向量进行处理,得到每一信息数据对应的信息向量;对每一用户数据的第二嵌入向量进行处理,得到每一用户数据对应的用户向量;基于每一信息数据对应的信息向量,以及每一用户数据对应的用户向量,对每一信息数据对应的信息向量进行更新;其中,更新后的信息向量用于信息推荐。2.根据权利要求1所述的方法,其特征在于,所述基于所述行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理,得到每一信息数据至少融合用户数据后的第一嵌入向量,以及每一用户数据至少融合信息数据后的第二嵌入向量,包括:基于所述样本数据集获取包括多个节点的二分图;其中,所述二分图中所述节点的节点类型包括用户节点、以及信息节点;一个用户节点用于表征一个用户数据,一个信息节点用于表征一个信息数据;所述二分图中相连接的用户节点和信息节点之间通过行为类型标签关联;对每一节点的节点数据进行特征提取,得到每一节点数据的第一特征向量;针对每一节点,根据行为类型标签对邻居节点进行采样,并融合所述节点和采样的邻居节点的第一特征向量,得到所述节点融合后的第二特征向量;其中,不同行为类型标签对应的邻居节点的采样权重不同;将所述二分图中,每一信息节点融合后的第二特征向量作为每一信息数据至少融合用户数据后的第一嵌入向量;将所述二分图中,每一用户节点融合后的第二特征向量作为每一用户数据至少融合信息数据后的第二嵌入向量。3.根据权利要求1或2所述的方法,其特征在于,所述对每一信息数据的第一嵌入向量进行处理,得到每一信息数据对应的信息向量,包括:根据行为类型标签对信息数据进行分类,得到不同行为类型标签的信息数据集;针对每一行为类型标签的信息数据集,根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理,得到每一信息数据对应的信息向量;其中,不同行为类型标签对应的向量处理方式不同。4.根据权利要求3所述的方法,其特征在于,所述行为类型标签包括点击行为标签;所述针对每一行为类型标签的信息数据集,根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理,得到每一信息数据对应的信息向量,包括:基于SENet模型学习点击行为标签的信息数据集中每一信息数据的第一嵌入向量对应的第一权重;利用第一权重对点击行为标签的信息数据集中所述第一权重对应的信息数据的第一嵌入向量进行加权处理,得到点击行为标签的信息数据集中每一信息数据对应的信息向量。
5.根据权利要求3所述的方法,其特征在于,所述行为类型标签包括点击行为之外的行为标签;所述针对每一行为类型标签的信息数据集,根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理,得到每一信息数据对应的信息向量,包括:对点击行为之外的行为标签信息数据集中关联同一用户的各信息数据,按照信息数据的行为发生时间组合各信息数据的...

【专利技术属性】
技术研发人员:蔡少雄刘博乔鹏飞
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1