The application discloses a method and device for dividing user communities, which relates to the field of data processing, and can improve the accuracy of dividing user communities, including: obtaining the call characteristics between the users to be divided, constructing the topological structure according to the call characteristics; calculating the link relationship between any two nodes according to the call characteristics and the first formula; and calculating the link relationship between any two nodes according to the link between any two nodes Relation, calculate the constraint of any node on its adjacent nodes; calculate the adjacent energy sum of the first node according to the constraint of the first adjacent node on the second node; calculate the importance degree of the third node according to the adjacent energy sum of the first node; if the importance degree of the third node is greater than or equal to the first threshold and the node degree is greater than or equal to the second threshold, then determine the third node as the core node; and The core node and its adjacent nodes are divided into the same community. This application is used to realize the accurate division of communities.
【技术实现步骤摘要】
一种用户社团划分方法及装置
本申请涉及数据处理领域,尤其涉及一种用户社团划分方法及装置。
技术介绍
目前运营商在进行用户分析的时候,往往只关心某个特定社团的用户。比如某种电子产品的个性化营销,运营商希望帮厂商找到与产品特征最相符的潜在用户;传统技术中采用用户节点的节点度来评价节点的重要性,通过衡量用户节点的节点度多少确定核心用户节点。该种方法仅需获取某些核心的用户节点,然后从该节点出发沿边扩展子图,不断扩大团体便可以得到需要的团体。但是该方法有以下两点缺陷,一是仅从用户与邻居的拓扑结构对用户节点的重要性进行判断,以确认其是否为核心用户节点是不够准确的;二是排除了中间用户节点这种特殊节点,中间用户节点在社团划分中虽然不满足社团划分中针对核心用户节点的划分方法,但是中间用户节点却是两个社团的天然界限,中间用户节点的确定有助于社团边界的确定。因此,现有技术并不能准确的对用户社团进行划分。如何真实准确的确定用户社团的核心用户节点及中间用户节点,进而准确的对用户社团进行划分,是目前用户社团划分方法亟需解决的问题。
技术实现思路
本申请提供一种用户社团划分方法及装置,能够提高用户社团划分的准确性。为达到上述目的,本申请采用如下技术方案:第一方面,本申请提供一种用户社团划分方法,该方法包括:获取待划分用户之间的通话特征;通话特征包括通话次数、每次通话时长及通话间隔,通话间隔为每次通话起始时刻与统计周期起始时刻的间隔;根据待划分用户之间的通话特征构建拓扑结构;拓扑结构包括至 ...
【技术保护点】
1.一种用户社团划分方法,其特征在于,包括:/n获取待划分用户之间的通话特征;所述通话特征包括通话次数、每次通话时长及通话间隔,所述通话间隔为每次通话起始时刻与统计周期起始时刻的间隔;/n根据所述待划分用户之间的通话特征构建拓扑结构;所述拓扑结构包括至少一个节点,所述节点与所述待划分用户一一对应;任两个存在通话的所述待划分用户在所述拓扑结构中对应的两个节点之间相互连接;/n根据所述拓扑结构,确定所述节点的节点度;/n根据所述通话特征,依据第一公式计算所述拓扑结构中任意两个所述节点之间的链接关系;/n根据所述任意两个所述节点之间的链接关系,计算任一所述节点对其任一邻接节点的约束;两个相互连接的所述节点互为邻接节点;/n根据第一邻接节点对第二节点的约束,计算第一节点的邻接精力和;所述第一邻接节点为所述拓扑结构中所述第一节点的任一邻接节点;所述第二节点为所述拓扑结构中所述第一邻接节点的任一邻接节点;所述第一节点为所述拓扑结构中第三节点的邻接节点,所述第三节点为所述拓扑结构中任一节点;所述邻接精力和为所有所述第一邻接节点的资源的和,所述第一邻接节点的资源为第一邻接节点对所述第二节点的约束的和; ...
【技术特征摘要】
1.一种用户社团划分方法,其特征在于,包括:
获取待划分用户之间的通话特征;所述通话特征包括通话次数、每次通话时长及通话间隔,所述通话间隔为每次通话起始时刻与统计周期起始时刻的间隔;
根据所述待划分用户之间的通话特征构建拓扑结构;所述拓扑结构包括至少一个节点,所述节点与所述待划分用户一一对应;任两个存在通话的所述待划分用户在所述拓扑结构中对应的两个节点之间相互连接;
根据所述拓扑结构,确定所述节点的节点度;
根据所述通话特征,依据第一公式计算所述拓扑结构中任意两个所述节点之间的链接关系;
根据所述任意两个所述节点之间的链接关系,计算任一所述节点对其任一邻接节点的约束;两个相互连接的所述节点互为邻接节点;
根据第一邻接节点对第二节点的约束,计算第一节点的邻接精力和;所述第一邻接节点为所述拓扑结构中所述第一节点的任一邻接节点;所述第二节点为所述拓扑结构中所述第一邻接节点的任一邻接节点;所述第一节点为所述拓扑结构中第三节点的邻接节点,所述第三节点为所述拓扑结构中任一节点;所述邻接精力和为所有所述第一邻接节点的资源的和,所述第一邻接节点的资源为第一邻接节点对所述第二节点的约束的和;
根据所述第一节点的邻接精力和计算所述第三节点的重要度;
若所述第三节点的重要度大于等于第一阈值且节点度大于等于第二阈值,则确定所述第三节点为核心节点;
将所述核心节点及所述核心节点的邻接节点划分为同一社团。
2.根据权利要求1所述的用户社团划分方法,其特征在于,所述确定所述节点的节点度之后还包括:
将节点度小于第三阈值的节点从所述拓扑结构中删除。
3.根据权利要求1所述的用户社团划分方法,其特征在于,将所述核心节点及所述核心节点的邻接节点划分为同一社团之后,所述方法还包括:
将中间节点从划分好的社团中删除;所述中间节点为重要度大于等于第一阈值且节点度小于第二阈值的节点。
4.根据权利要求1所述的用户社团划分方法,其特征在于,所述第一公式为:
其中,i为所述拓扑结构中任一节点,j为所述拓扑结构中除所述i以外的任一节点,zij为所述i与所述j之间的链接关系,γ表示时间衰减系数,T为当前统计周期的起始时刻,tk是所述当前统计周期内第k次通话的起始通话时刻,lk(i,j)为所述i和所述j第k次通话的通话时长。
5.根据权利要求1所述的用户社团划分方法,其特征在于,根据所述任意两个所述节点之间的链接关系,计算任一所述节点对其任一邻接节点的约束,包括:
根据任意两个所述节点之间的链接关系,依据第二公式计算第一占比;所述第一占比为所述任一所述节点与其任一邻接节点之间的链接关系占所述任一所述节点与其所有邻接节点之间的链接关系的和的比值;
根据所述第一占比,依据第三公式,计算任一所述节点对其任一邻接节点的约束;
所述第二公式为:
其中,i为所述任一所述节点,j为i的任一邻接节点,pij为第一占比,zij为所述i与所述j之间的链接关系,Γ(i)为所述i的邻接节点的集合,v为所述Γ(i)中任一元素;
所述第三公式为:
其中,Cij为所述i对所述j的约束,x为所述i和所述j共同的邻接节点。
6.根据权利要求1所述的用户社团划分方法,其特征在于,所述根据第一邻接节点对第二节点的约束,计算第一节点的邻接精力和,包括:
根据所述第一邻接节点对所述第二节点的约束,依据第四公式计算所述第一邻接节点的资源;
根据所述第一邻接节点的资源,依据第五公式计算所述第一节点的邻接精力和;
所述第四公式为:
k(j)=Cjk+Cjl+...+Cjm;
其中,j为所述第一邻接节点,k(j)为j的资源,k、l和m为不同的所述第二节点,Cjk为所述j对所述k的约束,Cjl为所述j对所述l的约束,Cjm为所述j对所述m的约束;
所述第五公式为:
Q(g)=k(j)+k(o)+...+k(p);
其中,g为所述第一节点,Q(g)为所述g的邻接精力和,j、o和p为不同的所述第一邻接节点,k(j)为所述j的资源,k(o)为所述o的资源,k(p)为所述p的资源。
7.根据权利要求1所述的用户社团划分方法,其特征在于,根据所述第一节点的邻接精力和计算所述第三节点的重要度,包括:
根据所述第一节点的邻接精力和,依据第六公式计算第二占比,所述第二占比为任一所述第一节点的邻接精力和与所有所述第一节点的邻接精力和的和的比值;
根据所述第二占比,依据第七公式计算所述第三节点对所述第一节点的最终约束;
根据所述第三节点对所述第一节点的最终约束,依据第八公式计算所述第三节点的重要度;
所述第六公式为:
其中,I为任一所述第三节点,B为任一所述第一节点,hIB为所述第二占比,Q(B)为所述B的邻接精力和,Γ(I)为所述I的邻接节点的集合,λ为所述Γ(I)中任一元素;
所述第七公式为:
其中,EIB为所述I对所述B的最终约束,y为所述I和所述B共同的邻接节点;
所述第八公式为:
EI=EIB+EIC+...+EIN;
其中,B、C和N为不同的第一节点,EI为所述I的重要...
【专利技术属性】
技术研发人员:樊学宝,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。