基于无监督学习的用户分类方法、装置、设备及存储介质制造方法及图纸

技术编号:23212740 阅读:21 留言:0更新日期:2020-01-31 21:51
本发明专利技术涉及基于无监督学习的用户分类方法、装置、计算机设备及存储介质,属于用户分类技术领域。该方法包括:获取待分类用户的第一原始特征;将第一原始特征输入到无监督学习的拓扑关系确定模型中;拓扑关系确定模型对应有目标损失函数;目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;第一特征表达式为第一原始特征对应的表达式,第二特征表达式为拓扑关系特征对应的表达式;根据拓扑关系确定模型的输出,得到待分类用户的目标拓扑关系特征;根据目标拓扑关系特征,确定待分类用户对应的用户类别。上述技术方案,在不需要人工提供用户标签的情况下,就能实现对网络用户的准确分类,能有效降低网络用户分类的成本。

Unsupervised learning based user classification methods, devices, devices and storage media

【技术实现步骤摘要】
基于无监督学习的用户分类方法、装置、设备及存储介质
本专利技术涉及用户分类
,特别是涉及基于无监督学习的用户分类方法、装置、计算机设备及存储介质。
技术介绍
随着网络技术的发展,网络用户的数量和种类越来越繁杂。很多情况下,需要对网络用户进行分类,并针对性地进行网络操作,例如:在社交网络分析领域,根据用户(在用户关系图中也可以称为节点)的特点进行精准广告投放、商品推荐、危险用户监控等。目前,主要通过用户关系图中的拓扑关系特征来表示用户信息以及各个用户之间的关系,并据此进行用户的分类。在实现本专利技术过程中,专利技术人发现传统方式中至少存在如下问题:传统技术主要是通过监督式的方法来训练模型并确定拓扑关系特征。但监督式的方法需要依赖人工辅助,由人工提供用户标签。实际上,在网络用户分析中,由于涉及亿级以上的用户量,利用人工对各个用户进行标注的成本非常高,这就导致用户分类的成本非常高。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
基于此,本专利技术实施例提供了基于无监督学习的用户分类方法、装置、计算机设备及存储介质,能有效降低对用户进行分类的成本。本专利技术实施例的内容如下:第一方面,本专利技术实施例提供一种基于无监督学习的用户分类方法,包括以下步骤:获取待分类用户的第一原始特征;将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。第二方面,本专利技术实施例提供一种基于无监督学习的用户分类装置,包括:原始特征获取模块,用于获取待分类用户的第一原始特征;特征输入模块,用于将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;拓扑关系确定模块,用于根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;用户类别确定模块,用于根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。第三方面,本专利技术实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取待分类用户的第一原始特征;将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取待分类用户的第一原始特征;将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。上述技术方案中的一个技术方案具有如下优点或有益效果:获取待分类用户的第一原始特征,根据第一原始特征对应的表达式和拓扑关系特征对应的表达式的相关度构建目标损失函数,依据该目标损失函数构建的拓扑关系确定模型是无监督学习的,将待分类用户的第一原始特征输入到该无监督学习的拓扑关系确定模型中,根据拓扑关系确定模型的输出,得到待分类用户的目标拓扑关系特征;并根据该目标拓扑关系特征,确定待分类用户对应的用户类别。在不需要人工提供用户标签的情况下,就能实现对用户的准确分类,能有效降低用户分类的成本。附图说明图1为一个实施例中基于无监督学习的用户分类方法的应用环境图;图2为一个实施例中基于无监督学习的用户分类方法的流程示意图;图3为一个实施例中用户关系图的结构示意图;图4为另一个实施例中用户关系图的结构示意图;图5为再一个实施例中用户关系图的结构示意图;图6为另一个实施例中基于无监督学习的用户分类方法的流程示意图;图7为再一个实施例中基于无监督学习的用户分类方法的流程示意图;图8为一个实施例中基于无监督学习的用户分类装置的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。本申请提供的基于无监督学习的用户分类方法可以应用于如图1所示的计算机设备中。该计算机设备可以是服务器,也可以是终端设备,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,处理器用于提供计算和控制能力;存储器包括非易失性存储介质、内存储器,该非易失性存储介质存储有操作系统、计算机程序(该计算机程序被处理器执行时实现一种基于无监督学习的用户分类方法)和数据库,该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境;数据库用于存储拓扑关系确定模型、目标损失函数、第一原始特征、目标拓扑关系特征、用户类别等数据;网络接口用于与外部的终端通过网络连接通信,例如,与输入装置连接,用于接收输入装置输入的第一原始特征。当然,输入装置也可以直接设置在该计算机设备上。其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现,终端设备可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。本领域技术人员本文档来自技高网...

【技术保护点】
1.一种基于无监督学习的用户分类方法,其特征在于,包括:/n获取待分类用户的第一原始特征;/n将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;/n根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;/n根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。/n

【技术特征摘要】
1.一种基于无监督学习的用户分类方法,其特征在于,包括:
获取待分类用户的第一原始特征;
将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;
根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;
根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。


2.根据权利要求1所述的方法,其特征在于,所述用户关系图中还包含有目标分类评估用户,所述目标分类评估用户为所述用户关系图中与所述待分类用户的节点相邻的节点对应的用户;
所述将所述第一原始特征输入到无监督学习的拓扑关系确定模型中的步骤之前,还包括:
获取第三特征表达式,以及所述目标分类评估用户与所述待分类用户之间的权重表达式;所述第三特征表达式为所述目标分类评估用户对应的第二原始特征的表达式;
根据所述第三特征表达式、所述权重表达式以及待确定的评估参数,得到所述无监督学习的拓扑关系确定模型。


3.根据权利要求2所述的方法,其特征在于,所述根据所述第三特征表达式、所述权重表达式以及待确定的评估参数,得到所述无监督学习的拓扑关系确定模型的步骤,包括:
计算所述第三特征表达式、所述权重表达式以及所述待确定的评估参数的乘积之和,得到所述无监督学习的拓扑关系确定模型。


4.根据权利要求3所述的方法,其特征在于,所述计算所述第三特征表达式、所述权重表达式以及所述待确定的评估参数的乘积之和,得到所述无监督学习的拓扑关系确定模型的步骤,包括:
计算所述第三特征表达式、所述权重表达式以及所述待确定的评估参数的乘积之和,所得到的无监督学习的拓扑关系确定模型如下:



其中,vi表示待分类用户对应的节点,vj表示所述目标分类评估用户对应的节点,N表示目标分类评估用户的数量,W表示待确定的评估参数,h(vi)表示节点vi的第一特征表达式,h(vj)表示节点vj的第三特征表达式,h1(vi)表示节点vi的第二特征表达式,表示所述目标分类评估用户与所述待分类用户之间的权重表达式。


5.根据权利要求4所述的方法,其特征在于,所述将所述第一原始特征输入到无监督学习的拓扑关系确定模型中的步骤,包括:
将所述第一原始特征输入到所述目标损失函数中;
最小化所述目标损失函数,得到所述待确定的评估参数的目标值;
将所述目标值输入到所述无监督学习的拓扑关系确定模型中。


6.根据权利要求1所述的方法,其特征在于,所述将所述第一原始特征输入到无监督学习的拓扑关系确定模型中的步骤之前,还包括:
获取所述第一特征表达式和所述第二特征表达式;
根据所述相关度、所述第一特征表达式和所述第二特征表达式,构建目标损失函数。


7.根据权利要求6所述的方法,其特征在于,所述根据所述相关度、所述第一特征表达式和所述第二特征表达式,构建目标损失函数的步骤,包括:
确定所述第一特征表达式和所述第二特征表达式的互信息表达式;所述互信息表达式用于表征所述相关度;
根据所述互信息表达式,得到...

【专利技术属性】
技术研发人员:黄文炳徐挺洋荣钰黄俊洲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1