一种获得用户画像的方法及装置制造方法及图纸

技术编号：26259455 阅读：21 留言：0更新日期：2020-11-06 17:54

本申请实施例提供了一种获得用户画像的方法及装置，涉及人工智能技术领域，该方法包括：获取目标用户的用户特征向量和目标应用中至少一个多媒体内容的内容标签的标签特征向量，然后根据用户特征向量与标签特征向量之间的相似度，确定目标用户的备选标签，进而基于备选标签确定目标用户的用户画像。相较于基于标签统计获得用户画像来说，用户特征向量更能全面表征用户喜好，从而提升获得的用户标签的准确性，进而提高获得的用户画像的准确性。其次，获得的备选标签不仅是目标用户的历史行为数据中的标签，还可以历史行为数据之外的标签，从而提高了泛化能力，扩展了目标用户的兴趣，使获得的用户画像更加全面准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种获得用户画像的方法及装置
本专利技术实施例涉及计算机领域，尤其涉及人工智能
中一种获得用户画像的方法及装置。
技术介绍
个性化推荐系统是互联网的核心技术之一，其基于用户行为与兴趣为用户推荐感兴趣的内容。用户画像，即用户信息结构化与标签化，通过刻画用户的人口属性、社会属性、兴趣偏好等各个维度的数据，对用户各方面的信息进行精准地刻画、分析，挖掘潜在价值，从而更好地提升个性化推荐的效果。目前在构建用户画像时，先从用户行为数据中抽取画像标签，对用户行为数据中涉及的画像标签进行简单的统计，按照频次对每个用户的画像标签进行打分，即频次越高、分数越高，之后再根据画像标签的打分获得用户画像。对于冷启动用户来说，由于行为数据较少，导致基于标签统计获得的用户画像的准确性较低，进而影响到根据用户画像进行的相关业务的精准度。
技术实现思路
本申请实施例提供了一种获得用户画像的方法及装置，用于提高获得的用户画像的准确性，并进一步提高内容推荐的精准度。一方面，本申请实施例提供了一种获得用户画像的方法，该方法...

【技术保护点】
1.一种获得用户画像的方法，其特征在于，包括：/n根据目标用户的属性信息以及历史行为数据确定所述目标用户的用户特征向量；/n获取目标应用中至少一个多媒体内容的内容标签的标签特征向量；/n根据所述目标用户的用户特征向量与所述标签特征向量之间的相似度，从所述至少一个多媒体内容的内容标签中确定所述目标用户的备选标签；/n基于所述目标用户的备选标签确定所述目标用户的用户画像。/n

【技术特征摘要】
1.一种获得用户画像的方法，其特征在于，包括：
根据目标用户的属性信息以及历史行为数据确定所述目标用户的用户特征向量；
获取目标应用中至少一个多媒体内容的内容标签的标签特征向量；
根据所述目标用户的用户特征向量与所述标签特征向量之间的相似度，从所述至少一个多媒体内容的内容标签中确定所述目标用户的备选标签；
基于所述目标用户的备选标签确定所述目标用户的用户画像。

2.如权利要求1所述的方法，其特征在于，所述获取目标应用中至少一个多媒体内容的内容标签的标签特征向量，包括：
确定所述至少一个多媒体内容中的每个多媒体内容在多个标签域中的内容标签；
通过用户画像模型，提取每个标签域中的内容标签的标签特征向量，所述用户画像模型是基于样本用户的用户特征向量与样本多媒体内容的内容特征向量之间的关联度训练得到的，所述样本多媒体内容的内容特征向量是对所述样本多媒体内容的内容标签的标签特征向量进行层级嵌入处理后获得的，所述样本用户的用户特征向量是对所述样本用户的用户特征的特征向量进行层级嵌入处理后获得的。

3.如权利要求2所述的方法，其特征在于，所述样本多媒体内容的内容特征向量是对所述样本多媒体内容的内容标签的标签特征向量进行层级嵌入处理后获得的，包括：
确定所述样本多媒体内容在多个标签域中的内容标签，并提取每个标签域中的内容标签的标签特征向量；
将每个标签域中的内容标签的标签特征向量融合，获得每个标签域的域内标签向量；
将多个标签域的域内标签向量融合，获得所述样本多媒体内容的内容特征向量。

4.如权利要求2所述的方法，其特征在于，所述样本用户的用户特征向量是对所述样本用户的用户特征的特征向量进行层级嵌入处理后获得的，包括：
确定所述样本用户在多个特征域中的用户特征，并提取每个特征域内的用户特征的特征向量；
将每个特征域内的用户特征的特征向量进行融合，获得每个特征域的域内特征向量；
将多个特征域的域内特征向量进行融合，获得所述样本用户的用户特征向量。

5.如权利要求2所述的方法，其特征在于，所述根据目标用户的属性信息以及历史行为数据确定所述目标用户的用户特征向量，包括：
根据所述目标用户的属性信息以及历史行为数据，确定所述目标用户在多个特征域中的用户特征；
通过所述用户画像模型，提取每个特征域内的用户特征的特征向量，并对每个特征域内的用户特征的特征向量进行层级嵌入处理，确定所述目标用户的用户特征向量。

6.如权利要求5所述的方法，其特征在于，所述对每个特征域内的用户特征的特征向量进行层级嵌入处理，确定所述目标用户的用户特征向量，包括：
将每个特征域内的用户特征的特征向量进行融合，获得每个特征域的域内特征向量；
将多个特征域的域内特征向量进行融合，获得所述目标用户的用户特征向量。

7.如权利要求2所述的方法，其特征在于，所述根据所述目标用户的用户特征向量与所述标签特征向量之间的相似度，从所述至少一个多媒体内容的内容标签中确定所述目标用户的备选标签，包括：
确定所述目标用户的用户特征向量与每个标签域中的内容标签的标签特征向量之间的相似度；
将所述至少一个多媒体内容在多个标签域中的内容标签中，相似度满足预设条件的内容标签确定为所述目标用户的备选标签。

8.如权利要求2至7任一项所述的方法，其特征在于，还包括：
通过所述用户画像模型，对每个多媒体内容在多个标签域中的内容标签的标签特征向量进行层级嵌入处理，确定每个多媒体内容的内容特征向量；并根据所述目标用...

【专利技术属性】
技术研发人员：王伟佳，陈鑫，闫肃，张旭，林乐宇，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人