重叠社群处理方法、装置以及电子设备制造方法及图纸

技术编号:23706383 阅读:36 留言:0更新日期:2020-04-08 11:27
本申请提供了一种重叠社群处理方法、装置以及电子设备,涉及数据处理技术领域,解决了集群重叠的情况对用户的识别过程造成影响的技术问题。该方法包括:基于多个样本对象之间的关系建立关系图的模型,关系图中包括多个用于表示样本对象的节点,节点对应标注有用于表示行为数据的标签;重复执行下述步骤,直至关系图的模型符合预期:根据标签利用标签传播算法将多个节点划分为多个社群;如果多个社群中存在重叠的社群,则确定重叠的社群中任意两个重叠的社群之间的节点重合度;如果节点重合度大于预设重合度,则将两个重叠的社群进行社群合并;判断社群合并后的关系图的模型是否符合预期。

Overlapping community processing methods, devices and electronic devices

【技术实现步骤摘要】
重叠社群处理方法、装置以及电子设备
本申请涉及数据处理
,尤其是涉及一种重叠社群处理方法、装置以及电子设备。
技术介绍
目前,在识别用户的欺诈危险程度过程中,需要考虑很多方面的因素。例如,借助个人历史借贷表现、基本收入开支情况及人口统计信息等,以此来识别贷款个人的欺诈危险程度。但是,在对多个用户进行欺诈危险程度集群划分的过程中,会存在一个用户同时属于两个以上集群的情况,这种集群重叠的情况很容易对用户的识别过程造成影响,导致识别结果不清楚。
技术实现思路
本专利技术的目的在于提供一种重叠社群处理方法、装置以及电子设备,以解决集群重叠的情况对用户的识别过程造成影响的技术问题。第一方面,本申请实施例提供了一种重叠社群处理方法,预先确定多个样本对象的行为数据;所述方法包括:基于多个所述样本对象之间的关系建立关系图的模型,所述关系图中包括多个用于表示所述样本对象的节点,所述节点对应标注有用于表示所述行为数据的标签;重复执行下述步骤,直至所述关系图的模型符合预期:根据所述标签利用标签传播算法将多个所述节点划分为多个社群;如果多个所述社群中存在重叠的社群,则确定所述重叠的社群中任意两个重叠的社群之间的节点重合度;如果所述节点重合度大于预设重合度,则将所述两个重叠的社群进行社群合并;判断社群合并后的所述关系图的模型是否符合预期。在一个可能的实现中,确定所述重叠的社群中任意两个重叠的社群之间的节点重合度的步骤,包括:确定所述重叠的社群中任意两个重叠的社群之间的重合节点数量;计算所述重合节点数量分别在所述两个重叠的社群中全部节点数量的占比,将所述占比作为节点重合度。在一个可能的实现中,如果所述节点重合度大于预设重合度,则将所述两个重叠的社群进行社群合并的步骤,包括:如果所述两个重叠的社群对应的所述节点重合度均大于预设重合度,则将所述两个重叠的社群进行社群合并。在一个可能的实现中,还包括:根据所述标签的内容,确定所述关系图的模型中每个所述社群的危险概率。在一个可能的实现中,还包括:获取待识别对象的行为数据;根据待识别对象的行为数据,利用所述关系图的模型确定所述待识别对象所属的目标社群;根据所述目标社群的危险概率,确定所述待识别对象的危险概率。在一个可能的实现中,根据所述目标社群的危险概率,确定所述待识别对象的危险概率的步骤,包括:如果所述目标社群的数量为多个,分别确定每个所述目标社群的危险概率;计算所述待识别对象在所述关系图的模型中对应的目标节点,在每个所述目标社群中的度中心性;根据所述目标节点在每个所述目标社群中的度中心性的加权平均值,确定所述待识别对象的危险概率。在一个可能的实现中,所述样本对象为个人用户;所述行为数据包括下述任意一项或多项:所述个人用户的历史借贷信息、还款逾期信息、不良记录信息以及多个所述个人用户之间的联系情况。第二方面,提供了一种重叠社群处理装置,预先确定多个样本对象的行为数据;所述装置包括:建立模块,用于基于多个所述样本对象之间的关系建立关系图的模型,所述关系图中包括多个用于表示所述样本对象的节点,所述节点对应标注有用于表示所述行为数据的标签;划分模块,用于根据所述标签利用标签传播算法将多个所述节点划分为多个社群;确定模块,用于如果多个所述社群中存在重叠的社群,则确定所述重叠的社群中任意两个重叠的社群之间的节点重合度;合并模块,用于如果所述节点重合度大于预设重合度,则将所述两个重叠的社群进行社群合并;判断模块,用于判断社群合并后的所述关系图的模型是否符合预期;所述划分模块、所述确定模块、所述合并模块以及所述判断模块重复执行,直至所述关系图的模型符合预期。第三方面,本申请实施例又提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的第一方面所述方法。第四方面,本申请实施例又提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述的第一方面所述方法。本申请实施例带来了以下有益效果:本申请实施例提供的一种重叠社群处理方法、装置以及电子设备,能够基于多个样本对象之间的关系建立包含了多个节点的关系图的模型,其中,节点能够表示样本对象,节点的标签能够表示样本对象的行为数据,然后,能够重复执行对关系图模型中社群的划分过程,直到判断出关系图的模型符合预期,在该社群划分的过程中,可以根据标签利用标签传播算法将多个节点划分为多个社群,并且,在存在重叠的社群的情况下,能够确定重叠社群的节点重合度,并在该节点重合度大于预设重合度时将两个重叠的社群进行社群合并,本方案中,通过确定重叠的社群之间的节点重合度,再根据节点重合度与预设重合度之间的对比情况,确定是否合并重叠的社群,使最终得到的关系图模型中的社群分布结果更加的合理且符合实际情况,从而减少了划分出的社群重叠的情况对识别过程造成的影响。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种重叠社群处理方法的流程示意图;图2为本申请实施例提供的重叠社群处理方法中,集群合并示例的示意图;图3为本申请实施例提供的一种重叠社群处理装置的结构示意图;图4为示出了本申请实施例所提供的一种电子设备的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。目前,无法核验多数据源之间的不一致问题,当贷款人提供的各类信息之间存在矛盾时,因无法识别而低估其欺诈风险。再者,在复杂网络中,存在着一个人所属多个社群的可能性,如果将一个点强行归于一个社群有可能导致对社群或欺诈团伙识别不清。...

【技术保护点】
1.一种重叠社群处理方法,其特征在于,预先确定多个样本对象的行为数据;所述方法包括:/n基于多个所述样本对象之间的关系建立关系图的模型,所述关系图中包括多个用于表示所述样本对象的节点,所述节点对应标注有用于表示所述行为数据的标签;/n重复执行下述步骤,直至所述关系图的模型符合预期:/n根据所述标签利用标签传播算法将多个所述节点划分为多个社群;/n如果多个所述社群中存在重叠的社群,则确定所述重叠的社群中任意两个重叠的社群之间的节点重合度;/n如果所述节点重合度大于预设重合度,则将所述两个重叠的社群进行社群合并;/n判断社群合并后的所述关系图的模型是否符合预期。/n

【技术特征摘要】
1.一种重叠社群处理方法,其特征在于,预先确定多个样本对象的行为数据;所述方法包括:
基于多个所述样本对象之间的关系建立关系图的模型,所述关系图中包括多个用于表示所述样本对象的节点,所述节点对应标注有用于表示所述行为数据的标签;
重复执行下述步骤,直至所述关系图的模型符合预期:
根据所述标签利用标签传播算法将多个所述节点划分为多个社群;
如果多个所述社群中存在重叠的社群,则确定所述重叠的社群中任意两个重叠的社群之间的节点重合度;
如果所述节点重合度大于预设重合度,则将所述两个重叠的社群进行社群合并;
判断社群合并后的所述关系图的模型是否符合预期。


2.根据权利要求1所述的方法,其特征在于,确定所述重叠的社群中任意两个重叠的社群之间的节点重合度的步骤,包括:
确定所述重叠的社群中任意两个重叠的社群之间的重合节点数量;
计算所述重合节点数量分别在所述两个重叠的社群中全部节点数量的占比,将所述占比作为节点重合度。


3.根据权利要求2所述的方法,其特征在于,如果所述节点重合度大于预设重合度,则将所述两个重叠的社群进行社群合并的步骤,包括:
如果所述两个重叠的社群对应的所述节点重合度均大于预设重合度,则将所述两个重叠的社群进行社群合并。


4.根据权利要求1所述的方法,其特征在于,还包括:
根据所述标签的内容,确定所述关系图的模型中每个所述社群的危险概率。


5.根据权利要求4所述的方法,其特征在于,还包括:
获取待识别对象的行为数据;
根据待识别对象的行为数据,利用所述关系图的模型确定所述待识别对象所属的目标社群;
根据所述目标社群的危险概率,确定所述待识别对象的危险概率。


6.根据权利要求5所述的方法,其特征在于,根据所述目标社群的危险概率,确定所述待识别对象的危险概率...

【专利技术属性】
技术研发人员:王议张晓雷张弦
申请(专利权)人:南京三百云信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1