数据处理方法、装置、计算机可读存储介质和计算机设备制造方法及图纸

技术编号:36366948 阅读:53 留言:0更新日期:2023-01-18 09:23
本申请实施例公开了一种数据处理方法、装置、计算机可读存储介质和计算机设备,涉及互联网技术领域;通过获取用户行为数据,并根据用户行为数据获取物品隐语义向量;根据物品隐语义向量进行聚类处理,得到第一聚类结果;根据第一聚类结果确定每一物品隐语义向量所属的聚类标识;基于聚类标识构建用户隐语义画像。以此,通过对物品隐语义向量进行聚类处理,根据第一聚类结果确定每一物品隐语义向量所属的聚类标识,进而利用聚类标识作为物品的表征维度来构建用户隐语义画像,提升了数据处理的效率,提高用户画像的准确度,进而提升推荐系统的推送准确性。系统的推送准确性。系统的推送准确性。

【技术实现步骤摘要】
数据处理方法、装置、计算机可读存储介质和计算机设备


[0001]本申请涉及互联网
,具体涉及一种数据处理方法、装置、计算机可读存储介质和计算机设备。

技术介绍

[0002]用户画像,也叫用户信息标签化、客户标签,是根据用户的社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。用户画像可以帮助企业为用户提供有针对性的服务。
[0003]在信息流产品中,分类和标签是表征物品的常用维度,是构建用户画像和特征体系的基础特征。但是人工分类不可避免的存在标注错误和粒度问题,影响了物品分类和标签的准确性,进一步降低用户画像的准确度,造成推荐系统准确性较低。

技术实现思路

[0004]本申请实施例提供一种数据处理方法、装置、计算机可读存储介质和计算机设备,可以提高用户画像的准确度,进而可以提升推荐系统的推送准确性。
[0005]本申请实施例提供一种数据处理方法,包括:
[0006]获取用户行为数据,并根据所述用户行为数据获取物品隐语义向量;
[0007]根据所述物品隐语义向量进行聚类处理,得到本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取用户行为数据,并根据所述用户行为数据获取物品隐语义向量;根据所述物品隐语义向量进行聚类处理,得到第一聚类结果;根据所述第一聚类结果确定每一物品隐语义向量所属的聚类标识;基于所述聚类标识构建用户隐语义画像。2.如权利要求1所述的数据处理方法,其特征在于,所述根据所述物品隐语义向量进行聚类处理,得到第一聚类结果,包括:确定目标聚类中心;计算所述物品隐语义向量到每一目标聚类中心的距离;将每一隐语义向量划分到距离最小的目标聚类中心所在的聚类中,得到划分后的聚类的数据;当聚类次数不满足预设中止条件时,根据划分后的聚类的数据重新确定目标聚类中心,并返回计算所述物品隐语义向量到每一目标聚类中心的距离步骤,直至所述聚类次数满足所述预设中止条件,得到第一聚类结果。3.如权利要求1所述的数据处理方法,其特征在于,所述根据所述第一聚类结果确定每一物品隐语义向量所属的聚类标识,包括:根据所述第一聚类结果更新目标聚类中心;根据更新后的目标聚类中心确定每一目标聚类中心的目标聚类标识;根据所述目标聚类标识更新每一物品隐语义向量所属的聚类标识。4.如权利要求1至3中任一项所述的数据处理方法,其特征在于,所述获取用户行为数据,并根据所述用户行为数据获取物品隐语义向量,包括:获取用户行为数据,将所述用户行为数据输入到训练后的预设模型中,得到所述用户行为数据对应的物品隐语义向量;所述获取用户行为数据,将所述用户行为数据输入到训练后的预设模型中,得到所述用户行为数据对应的物品隐语义向量之前,所述方法还包括:获取样本行为数据;将所述样本行为数据输入到预设模型中进行训练,当预设模型满足训练中止条件时,获取训练后的预设模型。5.如权利要求4所述的数据处理方法,其特征在于,所述将所述样本行为数据输入到预设模型中进行训练,包括:将所述样本行为数据输入到预设模型中,将所述样本行为数据划分...

【专利技术属性】
技术研发人员:樊锐强郑艾思张逾
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1