欺诈团伙挖掘方法、装置及电子设备制造方法及图纸

技术编号:22054982 阅读:22 留言:0更新日期:2019-09-07 15:09
本发明专利技术提供了一种欺诈团伙挖掘方法、装置及电子设备,在该方法中,先对原始数据进行了预处理,得到处理后的数据,该预处理的过程能够将噪点数据在建图之前删除,降低了噪点数据对建图的影响,同时,该过程中进行了迭代预处理和划分处理的过程,直至最终得到的多组社区数据中每组社区数据的节点数不大于预设阈值,或者,多组社区数据中每组社区数据的节点数不再变化为止,再对划分完成的每组社区数据进行可视化处理,得到社区网络图,这样,得到的每个社区网络图中都不存在大量节点,符合欺诈团伙特性,便于可视化和进行后续的欺诈团伙评价,最终确定的欺诈团伙准确性好,缓解了现有的欺诈团伙挖掘方法准确性差的技术问题。

Excavation methods, devices and electronic equipment of fraudulent gangs

【技术实现步骤摘要】
欺诈团伙挖掘方法、装置及电子设备
本专利技术涉及计算机的
,尤其是涉及一种欺诈团伙挖掘方法、装置及电子设备。
技术介绍
随着金融领域各种贷款或类贷款业务的普及,团伙欺诈案件逐渐增多,给投资人、公司和国家造成不同程度的损失。各公司和机构急于寻求一种技术方案来发现团伙欺诈案件,做到防范未然、及时阻止和追回损失。现有的欺诈团伙挖掘方法是先通过社区发现算法对数据进行分割,分割之后得到多个社区,然后再对每个社区进行欺诈团伙评价,从而确定其中的欺诈团伙。但是现有的社区发现算法,都是从网络拓扑结构的特性对数据进行的技术分割,从未考虑实际需求。最终,分割得到的社区结果中存在大量的大社区,这些大社区不便于后续的欺诈团伙的评价,并且这些大社区中还包含一些噪音节点或关系,导致最终确定的欺诈团伙准确性差。综上,现有的欺诈团伙挖掘方法准确性差。
技术实现思路
本专利技术的目的在于提供一种欺诈团伙挖掘方法、装置及电子设备,以缓解现有的欺诈团伙挖掘方法准确性差的技术问题。本专利技术提供的一种欺诈团伙挖掘方法,包括:获取原始数据;按照预处理规则对所述原始数据进行预处理,得到处理后的数据,其中,所述处理后的数据中不包含噪点数据;将所述处理后的数据保存至图数据库,得到与所述图数据库的存储结构对应的图数据;通过社区发现算法对所述图数据进行划分,得到多组社区数据;基于预设规则库对所述多组社区数据进行分析,根据分析结果确定目标预处理规则;将所述目标预处理规则作为所述预处理规则,并将所述多组社区数据作为所述原始数据,返回执行按照预处理规则对所述原始数据进行预处理的步骤,直至每组社区数据满足预设条件;所述预设条件包括:每组社区数据中的节点数不大于预设阈值,或者,每组社区数据中的节点数不再变化;对满足所述预设条件的每组社区数据进行可视化处理,得到社区网络图;通过预设欺诈团伙挖掘规则对所述社区网络图进行欺诈团伙评价,根据评价结果确定所述社区网络图对应的团伙是否为欺诈团伙。进一步的,所述预处理规则包括:预设数据清洗规则和噪音识别规则,按照预处理规则对所述原始数据进行预处理,得到处理后的数据包括:按照所述预设数据清洗规则对所述原始数据进行数据清洗,得到清洗后的数据;基于所述噪音识别规则识别所述清洗后的数据中的噪音数据;去除所述清洗后的数据中的噪音数据,得到所述处理后的数据。进一步的,所述社区发现算法包括但不限于以下任一种:louvain社区发现算法,基于标签传播的社团发现算法。进一步的,所述预设规则库中包括:预设特征与处理规则之间的对应关系,基于预设规则库对所述多组社区数据进行分析,根据分析结果确定目标预处理规则包括:对所述多组社区数据进行特征提取,得到所述多组社区数据的目标特征;将所述目标特征与所述预设规则库中的预设特征进行匹配;根据匹配结果在所述处理规则中确定与所述目标特征对应的目标处理规则;将所述目标处理规则作为所述目标预处理规则。进一步的,所述社区网络图中包括:个体节点、属性节点、所述个体节点和所述属性节点之间的关联关系。进一步的,通过预设欺诈团伙挖掘规则对所述社区网络图进行欺诈团伙评价,根据评价结果确定所述社区网络图对应的团伙是否为欺诈团伙包括:分析所述社区网络图与所述预设欺诈团伙挖掘规则的符合情况;根据所述符合情况对所述社区网络图进行打分,得到所述社区网络图的欺诈团伙得分;根据所述欺诈团伙得分确定所述社区网络图对应的团伙是否为欺诈团伙。本专利技术还提供了一种欺诈团伙挖掘装置,包括:获取模块,用于获取原始数据;预处理模块,用于按照预处理规则对所述原始数据进行预处理,得到处理后的数据,其中,所述处理后的数据中不包含噪点数据;保存模块,用于将所述处理后的数据保存至图数据库,得到与所述图数据库的存储结构对应的图数据;划分处理模块,用于通过社区发现算法对所述图数据进行划分,得到多组社区数据;分析模块,用于基于预设规则库对所述多组社区数据进行分析,根据分析结果确定目标预处理规则;返回执行模块,用于将所述目标预处理规则作为所述预处理规则,并将所述多组社区数据作为所述原始数据,返回执行按照预处理规则对所述原始数据进行预处理的步骤,直至每组社区数据满足预设条件;所述预设条件包括:每组社区数据中的节点数不大于预设阈值,或者,每组社区数据中的节点数不再变化;可视化处理模块,用于对满足所述预设条件的每组社区数据进行可视化处理,得到社区网络图;欺诈团伙评价模块,用于通过预设欺诈团伙挖掘规则对所述社区网络图进行欺诈团伙评价,根据评价结果确定所述社区网络图对应的团伙是否为欺诈团伙。进一步的,所述预处理规则包括:预设数据清洗规则和噪音识别规则,所述预处理模块包括:数据清洗单元,用于按照所述预设数据清洗规则对所述原始数据进行数据清洗,得到清洗后的数据;识别单元,用于基于所述噪音识别规则识别所述清洗后的数据中的噪音数据;去除单元,用于去除所述清洗后的数据中的噪音数据,得到所述处理后的数据。进一步的,所述社区发现算法包括但不限于以下任一种:louvain社区发现算法,基于标签传播的社团发现算法。本专利技术还提供了一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述内容中所述的方法的步骤。在本专利技术实施例中,先获取原始数据;然后按照预处理规则对原始数据进行预处理,得到处理后的数据,并将处理后的数据保存至图数据库,得到与图数据库的存储结构对应的图数据;进而通过社区发现算法对图数据进行划分,得到多组社区数据,再基于预设规则库对多组社区数据进行分析,根据分析结果确定目标预处理规则,并将目标预处理规则作为预处理规则,将多组社区数据作为原始数据,返回执行按照预处理规则对原始数据进行预处理的步骤,直至每组社区数据满足预设条件;预设条件包括:每组社区数据中的节点数不大于预设阈值,或者,每组社区数据中的节点数不再变化;最终对满足预设条件的每组社区数据进行可视化处理,得到社区网络图;再通过预设欺诈团伙挖掘规则对社区网络图进行欺诈团伙评价,根据评价结果确定社区网络图对应的团伙是否为欺诈团伙。通过上述的描述可知,本专利技术的欺诈团伙挖掘方法中,是先对原始数据进行了预处理,得到处理后的数据,该预处理的过程能够将噪点数据在建图之前删除,降低了噪点数据对建图的影响,同时,该过程中进行了迭代预处理和划分处理的过程,直至最终得到的多组社区数据中每组社区数据的节点数不大于预设阈值,或者,多组社区数据中每组社区数据的节点数不再变化为止,也就是直至最终得到的多组社区数据中每组社区数据的节点数符合欺诈团伙的特点,或者,最终得到的多组社区数据中每组社区数据的节点数不能再继续划分(即划分得到的已经是最小单元)为止,再对划分完成的每组社区数据进行可视化处理,得到社区网络图,这样,得到的每个社区网络图中都不存在大量节点,符合欺诈团伙特性,便于可视化和进行后续的欺诈团伙评价,最终确定的欺诈团伙准确性好,缓解了现有的欺诈团伙挖掘方法准确性差的技术问题。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造本文档来自技高网...

【技术保护点】
1.一种欺诈团伙挖掘方法,其特征在于,包括:获取原始数据;按照预处理规则对所述原始数据进行预处理,得到处理后的数据,其中,所述处理后的数据中不包含噪点数据;将所述处理后的数据保存至图数据库,得到与所述图数据库的存储结构对应的图数据;通过社区发现算法对所述图数据进行划分,得到多组社区数据;基于预设规则库对所述多组社区数据进行分析,根据分析结果确定目标预处理规则;将所述目标预处理规则作为所述预处理规则,并将所述多组社区数据作为所述原始数据,返回执行按照预处理规则对所述原始数据进行预处理的步骤,直至每组社区数据满足预设条件;所述预设条件包括:每组社区数据中的节点数不大于预设阈值,或者,每组社区数据中的节点数不再变化;对满足所述预设条件的每组社区数据进行可视化处理,得到社区网络图;通过预设欺诈团伙挖掘规则对所述社区网络图进行欺诈团伙评价,根据评价结果确定所述社区网络图对应的团伙是否为欺诈团伙。

【技术特征摘要】
1.一种欺诈团伙挖掘方法,其特征在于,包括:获取原始数据;按照预处理规则对所述原始数据进行预处理,得到处理后的数据,其中,所述处理后的数据中不包含噪点数据;将所述处理后的数据保存至图数据库,得到与所述图数据库的存储结构对应的图数据;通过社区发现算法对所述图数据进行划分,得到多组社区数据;基于预设规则库对所述多组社区数据进行分析,根据分析结果确定目标预处理规则;将所述目标预处理规则作为所述预处理规则,并将所述多组社区数据作为所述原始数据,返回执行按照预处理规则对所述原始数据进行预处理的步骤,直至每组社区数据满足预设条件;所述预设条件包括:每组社区数据中的节点数不大于预设阈值,或者,每组社区数据中的节点数不再变化;对满足所述预设条件的每组社区数据进行可视化处理,得到社区网络图;通过预设欺诈团伙挖掘规则对所述社区网络图进行欺诈团伙评价,根据评价结果确定所述社区网络图对应的团伙是否为欺诈团伙。2.根据权利要求1所述的方法,其特征在于,所述预处理规则包括:预设数据清洗规则和噪音识别规则,按照预处理规则对所述原始数据进行预处理,得到处理后的数据包括:按照所述预设数据清洗规则对所述原始数据进行数据清洗,得到清洗后的数据;基于所述噪音识别规则识别所述清洗后的数据中的噪音数据;去除所述清洗后的数据中的噪音数据,得到所述处理后的数据。3.根据权利要求1所述的方法,其特征在于,所述社区发现算法包括但不限于以下任一种:louvain社区发现算法,基于标签传播的社团发现算法。4.根据权利要求1所述的方法,其特征在于,所述预设规则库中包括:预设特征与处理规则之间的对应关系,基于预设规则库对所述多组社区数据进行分析,根据分析结果确定目标预处理规则包括:对所述多组社区数据进行特征提取,得到所述多组社区数据的目标特征;将所述目标特征与所述预设规则库中的预设特征进行匹配;根据匹配结果在所述处理规则中确定与所述目标特征对应的目标处理规则;将所述目标处理规则作为所述目标预处理规则。5.根据权利要求1所述的方法,其特征在于,所述社区网络图中包括:个体节点、属性节点、所述个体节点和所述属性节点之间的关联关系。6.根据权利要求1所述的方法,其特征在于,通过预设欺诈团伙挖掘规则对所述社区...

【专利技术属性】
技术研发人员:张亮杰袁力王亚亮陈亮
申请(专利权)人:北京阿尔山金融科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1