用户画像分群方法和装置制造方法及图纸

技术编号:15691524 阅读:56 留言:0更新日期:2017-06-24 04:48
本公开实施例涉及一种用户画像分群方法和装置,涉及数据分析领域,能够使用户画像分群更为稳定和准确。该方法包括:基于每个用户画像的标签构建标签网络G(V,E),其中V表示标签网络中的顶点集合,每个顶点表示一个用户画像,E表示标签网络中的边集合,每条边表示与拥有至少一个共同标签的两个用户画像相对应的两个顶点的连线;基于标签网络构建线图网络G'(V',E',W'),其中,V'表示线图网络中的顶点集合,每个顶点表示标签网络中的一条边,E'表示线图网络中的边集合,每条边表示线图网络中与标签网络中有公共顶点的两条边相对应的两个顶点的连线,W'表示线图网络中的边的权值集合;对线图网络中的顶点进行社团划分;将社团划分结果转换成用户画像分群结果。

User portrait grouping method and device

The embodiment of the invention relates to a user portrait grouping method and a device, which relates to the field of data analysis, and enables the user to draw images in a more stable and accurate manner. The method includes: each user portrait label label construction of network based on G (V, E), wherein V represents a tag network vertex set, each vertex represents a user portrait, E said the labels of edges in the network set, each edge represents two vertices and have at least one common label two users. Picture corresponding to the connection line; to construct a label network network based on G'(V', E', W'), among them, V'is the line graph network vertex set, each vertex labels an edge in a network, E' said the line graph of edges in the network set, each side that has two vertices two edges of common vertices corresponding to the graph in the network and the network connection label, W'said the line graph of edges in the network weights set; community division of line graph vertices of the network; will the partition result into user portrait clustering nodes Fruit.

【技术实现步骤摘要】
用户画像分群方法和装置
本公开实施例涉及数据分析领域,具体地,涉及一种用户画像分群方法和装置。
技术介绍
用户画像分群对于网络营销环境的最大改变在于打破了数据孤岛并真实了解用户,能够将社交网络中的一个个独立用户关联起来并对其进行分组。目前的用户画像分群方法对参数的依赖性非常强,例如K-means算法对k的取值以及初始中心的向量选择的依赖性很大,这使得用户画像分群的结果不稳定。
技术实现思路
本公开实施例的目的是提供一种用户画像分群方法和装置,能够得到稳定的用户画像分群结果。为了实现上述目的,本公开实施例提供一种用户画像分群方法,该方法包括:基于每个用户画像的标签构建标签网络G(V,E),其中V表示所述标签网络中的顶点集合,每个顶点表示一个用户画像,E表示所述标签网络中的边集合,每条边表示与拥有至少一个共同标签的两个用户画像相对应的两个顶点之间的连线;基于所述标签网络构建线图网络G'(V',E',W'),其中,V'表示所述线图网络中的顶点集合,所述线图网络中的一个顶点表示所述标签网络中的一条边,E'表示所述线图网络中的边集合,所述线图网络中的每条边表示所述线图网络中与所述标签网络中有公共顶点的两条边相对应的两个顶点之间的连线,W'表示所述线图网络中的边的权值集合;基于所述线图网络,对所述线图网络中的顶点进行社团划分;将社团划分结果转换成用户画像分群结果。可选地,所述线图网络中的边的权值通过以下步骤来计算:计算所述标签网络中的边的权值;基于所计算的所述标签网络中的边的权值,计算所述标签网络中每两条有公共顶点的边之间的相似度;将所述线图网络中的每条边的权值设置为等于该边的两个顶点在所述标签网络中对应的两条边之间的相似度。可选地,所述标签网络中的边的权值通过以下公式计算:其中,i和j表示所述标签网络中的两个顶点,eij表示顶点i和j之间的边,wij表示边eij的权值。可选地,所述相似度通过以下公式计算:其中,i、j、k和m表示所述标签网络中的顶点,eik表示顶点i和k之间的边,ejk表示顶点j和k之间的边,边eik和ejk连接相同的顶点k,Ni表示由顶点i的所有邻居顶点构成的集合,且i∈Ni,Nj表示由顶点j的所有邻居顶点构成的集合,wim表示顶点i和m之间的边eim的权值,wjm表示顶点j和m之间的边ejm的权值。可选地,所述将社团划分结果转换成用户画像分群结果,包括:将所述线图网络中被划分到同一个社团的顶点所对应的所述标签网络中的顶点划分到同一个用户画像分群中。本公开实施例还提供一种用户画像分群装置,该装置包括:标签网络构建模块,用于基于每个用户画像的标签构建标签网络G(V,E),其中V表示所述标签网络中的顶点集合,每个顶点表示一个用户画像,E表示所述标签网络中的边集合,每条边表示与拥有至少一个共同标签的两个用户画像相对应的两个顶点之间的连线;线图网络构建模块,用于基于所述标签网络构建线图网络G′(V′,E′,W′),其中,V′表示所述线图网络中的顶点集合,所述线图网络中的一个顶点表示所述标签网络中的一条边,E′表示所述线图网络中的边集合,所述线图网络中的每条边表示所述线图网络中与所述标签网络中有公共顶点的两条边相对应的两个顶点之间的连线,W′表示所述线图网络中的边的权值集合;社团划分模块,用于基于所述线图网络对所述线图网络中的顶点进行社团划分;转换模块,用于将社团划分结果转换成用户画像分群结果。可选地,所述线图网络构建模块通过以下方式计算所述线图网络中的边的权值:计算所述标签网络中的边的权值;基于所计算的所述标签网络中的边的权值,计算所述标签网络中每两条有公共顶点的边之间的相似度;将所述线图网络中的每条边的权值设置为等于该边的两个顶点在所述标签网络中对应的两条边之间的相似度。可选地,所述线图网络构建模块通过以下公式计算所述标签网络中的边的权值:其中,i和j表示所述标签网络中的两个顶点,eij表示顶点i和j之间的边,wij表示边eij的权值。可选地,所述线图网络构建模块通过以下公式计算所述相似度:其中,i、j、k和m表示所述标签网络中的顶点,eik表示顶点i和k之间的边,ejk表示顶点j和k之间的边,边eik和ejk连接相同的顶点k,Ni表示由顶点i的所有邻居顶点构成的集合,且i∈Ni,Nj表示由顶点j的所有邻居顶点构成的集合,wim表示顶点i和m之间的边eim的权值,wjm表示顶点j和m之间的边ejm的权值。可选地,所述转换模块用于将所述线图网络中被划分到同一个社团的顶点所对应的所述标签网络中的顶点划分到同一个用户画像分群中。通过上述技术方案,由于在用户画像分群的过程中并不需要任何的参数,而是仅基于用户画像的标签就能够进行用户画像分群,因此避免了分群结果对参数的依赖性,对于确定的一群标签化用户而言,能够得到稳定的用户画像分群结果。与现有的仅仅根据标签来人为划分用户群组的方法相比,能够大大减小人力成本。另外,通过基于线图网络进行社团划分,能够实现同一用户画像可能会被划分到不同的用户画像分群中的效果,从而使得用户画像分群更为准确。本公开实施例的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开实施例,但并不构成对本公开实施例的限制。在附图中:图1是根据本公开一种实施例的用户画像分群方法的流程图。图2是根据本公开一种实施例构建的标签网络的示意图。图3是根据本公开一种实施例构建的线图网络的示意图。图4是根据本公开一种实施例的计算线图网络中的边的权值的流程图。图5是根据本公开一种实施例的用户画像分群装置的示意框图。具体实施方式以下结合附图对本公开实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开实施例,并不用于限制本公开实施例。根据本公开的一种实施例,提供一种用户画像分群方法,如图1所示,该方法可以包括以下步骤S101至S104。在步骤S101中,基于每个用户画像的标签构建标签网络G(V,E),其中V表示所述标签网络中的顶点集合,每个顶点表示一个用户画像,E表示所述标签网络中的边集合,每条边表示与拥有至少一个共同标签的两个用户画像相对应的两个顶点之间的连线。在营销网络或社交网络等中,通常希望分析某个指标数字背后的用户具备哪些特征——他们的人群属性、他们的行为特点,更重要的作用是发现产品问题的背后的原因,并从中发现产品有效改进提升的机会或方向,这就需要进行用户画像分群。用户分群的“画像”,其焦点工作就是为用户群打“标签”,而标签通常是指人为规定的高度精炼的特征标识,如年龄、性别、地域、用户偏好(例如喜欢打篮球)等,最后将用户分群的所有标签综合来看,就可以勾勒出该用户群的立体“画像”了。以下以A、B、C和D四个用户为例对步骤S101进行举例说明。用户A被标识的标签包括a、b、c。用户B被标识的标签包括a、b、c、d。用户C被标识的标签包括b和c。用户D被标识的标签包括d。则基于用户A、B、C和D所拥有的标签构建的标签网络如图2所示。其中,在图2中,用户A、B、C、D被构建成标签网络的四个顶点,形成了顶点集合V;由于用户AC之间、用户BC之间、用户AB本文档来自技高网...
用户画像分群方法和装置

【技术保护点】
一种用户画像分群方法,其特征在于,该方法包括:基于每个用户画像的标签构建标签网络G(V,E),其中V表示所述标签网络中的顶点集合,每个顶点表示一个用户画像,E表示所述标签网络中的边集合,每条边表示与拥有至少一个共同标签的两个用户画像相对应的两个顶点之间的连线;基于所述标签网络构建线图网络G′(V′,E′,W′),其中,V′表示所述线图网络中的顶点集合,所述线图网络中的一个顶点表示所述标签网络中的一条边,E′表示所述线图网络中的边集合,所述线图网络中的每条边表示所述线图网络中与所述标签网络中有公共顶点的两条边相对应的两个顶点之间的连线,W′表示所述线图网络中的边的权值集合;基于所述线图网络,对所述线图网络中的顶点进行社团划分;将社团划分结果转换成用户画像分群结果。

【技术特征摘要】
1.一种用户画像分群方法,其特征在于,该方法包括:基于每个用户画像的标签构建标签网络G(V,E),其中V表示所述标签网络中的顶点集合,每个顶点表示一个用户画像,E表示所述标签网络中的边集合,每条边表示与拥有至少一个共同标签的两个用户画像相对应的两个顶点之间的连线;基于所述标签网络构建线图网络G′(V′,E′,W′),其中,V′表示所述线图网络中的顶点集合,所述线图网络中的一个顶点表示所述标签网络中的一条边,E′表示所述线图网络中的边集合,所述线图网络中的每条边表示所述线图网络中与所述标签网络中有公共顶点的两条边相对应的两个顶点之间的连线,W′表示所述线图网络中的边的权值集合;基于所述线图网络,对所述线图网络中的顶点进行社团划分;将社团划分结果转换成用户画像分群结果。2.根据权利要求1所述的方法,其特征在于,所述线图网络中的边的权值通过以下步骤来计算:计算所述标签网络中的边的权值;基于所计算的所述标签网络中的边的权值,计算所述标签网络中每两条有公共顶点的边之间的相似度;将所述线图网络中的每条边的权值设置为等于该边的两个顶点在所述标签网络中对应的两条边之间的相似度。3.根据权利要求2所述的方法,其特征在于,所述标签网络中的边的权值通过以下公式计算:其中,i和j表示所述标签网络中的两个顶点,eij表示顶点i和j之间的边,wij表示边eij的权值。4.根据权利要求2或3所述的方法,其特征在于,所述相似度通过以下公式计算:其中,i、j、k和m表示所述标签网络中的顶点,eik表示顶点i和k之间的边,ejk表示顶点j和k之间的边,边eik和ejk连接相同的顶点k,Ni表示由顶点i的所有邻居顶点构成的集合,且i∈Ni,Nj表示由顶点j的所有邻居顶点构成的集合,wim表示顶点i和m之间的边eim的权值,wjm表示顶点j和m之间的边ejm的权值。5.根据权利要求1所述的方法,其特征在于,所述将社团划分结果转换成用户画像分群结果,包括:将所述线图网络中被划分到同一个社团的顶点所对应的所述标签网络中的顶点划分到同一个用户画像分群中。6.一种用户画像分群装置,其特征在于,该装置包括:...

【专利技术属性】
技术研发人员:王阳
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1