用户画像生成方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号：20389680 阅读：19 留言：0更新日期：2019-02-20 02:46

本公开涉及一种用户画像生成方法、装置、电子设备及计算机可读介质。该方法包括：获取用户的行为信息和/或行为对应的物品描述信息；通过行为信息生成物品集合；通过物品描述信息生成描述文档；将所述物品集合和/或所述描述文档输入概率图模型中，以通过所述概率图模型计算文档主题向量和/或物品主题向量；以及通过文档主题向量和/或物品主题向量生成所述用户的用户画像。本公开涉及的用户画像生成方法、装置、电子设备及计算机可读介质，能够提高物品描述信息在用户画像中的覆盖率，提升用户画像精度。

全部详细技术资料下载

【技术实现步骤摘要】
用户画像生成方法、装置、电子设备及计算机可读介质
本公开涉及计算机信息处理领域，具体而言，涉及一种用户画像生成方法、装置、电子设备及计算机可读介质。
技术介绍
用户画像又称用户角色，作为一种勾画目标用户、联系用户诉求与设计方向的有效工具，用户画像在各领域得到了广泛的应用。在实际生成用户画像的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来，作为实际用户的虚拟代表，以期望基于用户画像用于后续挖掘用户兴趣。在用户兴趣挖掘中，目前常用物品描述信息及用户行为信息来构建用户画像。首先利用物品描述信息对用户购买或者下载的物品进行聚类或者分类；然后依据用户的行为信息，将从物品描述中获得的类目信息映射到用户层面。但是，目前用户画像挖掘方法在实际应用中存在一些问题。首先，部分物品缺失描述信息，例如，物品可例如为应用程序，而拥有描述信息的应用程序只占所有应用程序数量的60％左右，利用上述方法进行挖掘，不可避免的将丢弃掉40％不包含描述信息的应用程序及用户在应用程序上的行为。这种将物品信息和行为信息的剔除行为，容易造成兴趣对用户的覆盖率下降及用户画像不够精准的问题。因此，需要一种新的用户画像生成方法、装置、电子设备及计算机可读介质。在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
有鉴于此，本公开提供一种用户画像生成方法、装置、电子设备及计算机可读介质，能够提高物品描述信息在用户画像中的覆盖率，提升用户画像精度。本公开的其他特性和优点将通过下面的详细描述变得显然，或部分...

【技术保护点】
1.一种用户画像生成方法，其特征在于，包括：获取用户的行为信息和/或行为对应的物品描述信息；通过行为信息生成物品集合；通过物品描述信息生成描述文档；将所述物品集合和/或所述描述文档输入概率图模型中，以通过所述概率图模型计算文档主题向量和/或物品主题向量；以及通过文档主题向量和/或物品主题向量生成所述用户的用户画像。

【技术特征摘要】
1.一种用户画像生成方法，其特征在于，包括：获取用户的行为信息和/或行为对应的物品描述信息；通过行为信息生成物品集合；通过物品描述信息生成描述文档；将所述物品集合和/或所述描述文档输入概率图模型中，以通过所述概率图模型计算文档主题向量和/或物品主题向量；以及通过文档主题向量和/或物品主题向量生成所述用户的用户画像。2.如权利要求1所述的方法，其特征在于，还包括：根据一个或多个用户的行为信息和/或对应的物品描述信息，通过多输入潜在狄利克雷分布模型而生成所述概率图模型，所述多输入潜在狄利克雷分布模型的输入为多个数据集。3.如权利要求2所述的方法，其特征在于，根据一个或多个用户的行为信息和/或对应的物品描述信息，通过多输入潜在狄利克雷分布模型而生成所述概率图模型包括：通过一个或多个行为信息生成物品集合组；通过一个或多个物品描述信息生成描述文档组；以及通过所述物品集合组与所述描述文档组，训练所述多输入潜在狄利克雷分布模型，以生成所述概率图模型。4.如权利要求3所述的方法，其特征在于，通过所述物品集合组与所述描述文档组训练所述多输入潜在狄利克雷分布模型以生成所述概率图模型包括：将所述物品集合组与所述描述文档组输入多输入潜在狄利克雷分布模型，以获取第一文档主题向量与第一物品主题向量；通过吉布斯抽样对所述第一文档主题向量与所述第一物品主题向量进行迭代抽样计算；以及在迭代抽样计算满足条件时，通过当前的多输入潜在狄利克雷分布模型生成所述概率图模型。5.如权利要求4所述的方法，其特征在于，通过当前的多输入潜在狄利克雷分布模型生成所述概率图模型包括：通过多输入潜在狄利克雷分布模型的第一层模型结构生成对应于所述第一文档主题向量的文档主题矩阵；通过多输入潜在狄利克雷分布模型的第二层模型结构生成对应于所述第一物品主题向量的物品主题矩阵；以及根据所述文档主题矩阵、所述物品主题矩阵生成所述概率图模型。6.如权利要求1所述的方法，其特征在于，将所述物品集合和/或所述描述文档输入概率图模型中，以通过所述概率图模型计算文档主题向量和/或物品主题向量包括：根据所述物品集合确定关键物品，根据所述描述文档确定关键词；至少通过所述关键词、所述关键物品构建概率函数；以及将所述关键词及其对应的...

【专利技术属性】
技术研发人员：蔡业首，汤煌，张小鹏，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人