基于无监督学习的用户分类方法、装置、设备及存储介质制造方法及图纸

技术编号：23212740 阅读：21 留言：0更新日期：2020-01-31 21:51

本发明专利技术涉及基于无监督学习的用户分类方法、装置、计算机设备及存储介质，属于用户分类技术领域。该方法包括：获取待分类用户的第一原始特征；将第一原始特征输入到无监督学习的拓扑关系确定模型中；拓扑关系确定模型对应有目标损失函数；目标损失函数根据第一特征表达式和第二特征表达式的相关度构建；第一特征表达式为第一原始特征对应的表达式，第二特征表达式为拓扑关系特征对应的表达式；根据拓扑关系确定模型的输出，得到待分类用户的目标拓扑关系特征；根据目标拓扑关系特征，确定待分类用户对应的用户类别。上述技术方案，在不需要人工提供用户标签的情况下，就能实现对网络用户的准确分类，能有效降低网络用户分类的成本。

Unsupervised learning based user classification methods, devices, devices and storage media

全部详细技术资料下载

【技术实现步骤摘要】
基于无监督学习的用户分类方法、装置、设备及存储介质
本专利技术涉及用户分类
，特别是涉及基于无监督学习的用户分类方法、装置、计算机设备及存储介质。
技术介绍
随着网络技术的发展，网络用户的数量和种类越来越繁杂。很多情况下，需要对网络用户进行分类，并针对性地进行网络操作，例如：在社交网络分析领域，根据用户(在用户关系图中也可以称为节点)的特点进行精准广告投放、商品推荐、危险用户监控等。目前，主要通过用户关系图中的拓扑关系特征来表示用户信息以及各个用户之间的关系，并据此进行用户的分类。在实现本专利技术过程中，专利技术人发现传统方式中至少存在如下问题：传统技术主要是通过监督式的方法来训练模型并确定拓扑关系特征。但监督式的方法需要依赖人工辅助，由人工提供用户标签。实际上，在网络用户分析中，由于涉及亿级以上的用户量，利用人工对各个用户进行标注的成本非常高，这就导致用户分类的成本非常高。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
基于此，本专利技术实施例提供了基于无监督学习的用户分类方法、装置、计算机设备及存储介质，能有效降低对用户进行分类的成本。本专利技术实施例的内容如下：第一方面，本专利技术实施例提供一种基于无监督学习的用户分类方法，包括以下步骤：获取待分类用户的第一原始特征；将所述第一原始特征输入到无监督学习的拓扑关系确定模型中；所述拓扑关系确定模型对应有目...

【技术保护点】
1.一种基于无监督学习的用户分类方法，其特征在于，包括：/n获取待分类用户的第一原始特征；/n将所述第一原始特征输入到无监督学习的拓扑关系确定模型中；所述拓扑关系确定模型对应有目标损失函数；所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建；所述第一特征表达式为所述第一原始特征对应的表达式，所述第二特征表达式为拓扑关系特征对应的表达式；所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系；/n根据所述拓扑关系确定模型的输出，得到所述待分类用户的目标拓扑关系特征；/n根据所述目标拓扑关系特征，确定所述待分类用户对应的用户类别。/n

【技术特征摘要】
1.一种基于无监督学习的用户分类方法，其特征在于，包括：
获取待分类用户的第一原始特征；
将所述第一原始特征输入到无监督学习的拓扑关系确定模型中；所述拓扑关系确定模型对应有目标损失函数；所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建；所述第一特征表达式为所述第一原始特征对应的表达式，所述第二特征表达式为拓扑关系特征对应的表达式；所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系；
根据所述拓扑关系确定模型的输出，得到所述待分类用户的目标拓扑关系特征；
根据所述目标拓扑关系特征，确定所述待分类用户对应的用户类别。

2.根据权利要求1所述的方法，其特征在于，所述用户关系图中还包含有目标分类评估用户，所述目标分类评估用户为所述用户关系图中与所述待分类用户的节点相邻的节点对应的用户；
所述将所述第一原始特征输入到无监督学习的拓扑关系确定模型中的步骤之前，还包括：
获取第三特征表达式，以及所述目标分类评估用户与所述待分类用户之间的权重表达式；所述第三特征表达式为所述目标分类评估用户对应的第二原始特征的表达式；
根据所述第三特征表达式、所述权重表达式以及待确定的评估参数，得到所述无监督学习的拓扑关系确定模型。

3.根据权利要求2所述的方法，其特征在于，所述根据所述第三特征表达式、所述权重表达式以及待确定的评估参数，得到所述无监督学习的拓扑关系确定模型的步骤，包括：
计算所述第三特征表达式、所述权重表达式以及所述待确定的评估参数的乘积之和，得到所述无监督学习的拓扑关系确定模型。

4.根据权利要求3所述的方法，其特征在于，所述计算所述第三特征表达式、所述权重表达式以及所述待确定的评估参数的乘积之和，得到所述无监督学习的拓扑关系确定模型的步骤，包括：
计算所述第三特征表达式、所述权重表达式以及所述待确定的评估参数的乘积之和，所得到的无监督学习的拓扑关系确定模型如下：

其中，vi表示待分类用户对应的节点，vj表示所述目标分类评估用户对应的节点，N表示目标分类评估用户的数量，W表示待确定的评估参数，h(vi)表示节点vi的第一特征表达式，h(vj)表示节点vj的第三特征表达式，h1(vi)表示节点vi的第二特征表达式，表示所述目标分类评估用户与所述待分类用户之间的权重表达式。

5.根据权利要求4所述的方法，其特征在于，所述将所述第一原始特征输入到无监督学习的拓扑关系确定模型中的步骤，包括：
将所述第一原始特征输入到所述目标损失函数中；
最小化所述目标损失函数，得到所述待确定的评估参数的目标值；
将所述目标值输入到所述无监督学习的拓扑关系确定模型中。

6.根据权利要求1所述的方法，其特征在于，所述将所述第一原始特征输入到无监督学习的拓扑关系确定模型中的步骤之前，还包括：
获取所述第一特征表达式和所述第二特征表达式；
根据所述相关度、所述第一特征表达式和所述第二特征表达式，构建目标损失函数。

7.根据权利要求6所述的方法，其特征在于，所述根据所述相关度、所述第一特征表达式和所述第二特征表达式，构建目标损失函数的步骤，包括：
确定所述第一特征表达式和所述第二特征表达式的互信息表达式；所述互信息表达式用于表征所述相关度；
根据所述互信息表达式，得到...

【专利技术属性】
技术研发人员：黄文炳，徐挺洋，荣钰，黄俊洲，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人