一种基于优化知识图谱的犯罪团伙挖掘分析方法技术

技术编号:38998436 阅读:13 留言:0更新日期:2023-10-07 10:30
本发明专利技术属于数据挖掘技术领域,具体提供了一种基于优化知识图谱的犯罪团伙挖掘分析方法,包括以下步骤:导入数据,构建专题知识图谱并获取分布式计算图谱;进行连通计算得到高密度连接的社区子图;将社区子图实体关联重点人员集合进行过滤优化,构建基础信息计算图谱;通过社区划分算法对基础信息计算图谱节点进行划分,得到团伙结果集,生成对应标签信息;定时迭代上述步骤,回写团伙标签信息到专题知识图谱,可实现团伙划分结果动态展示和修正模糊团体归属。本发明专利技术通过图分布式计算并关联重点人员数据库优化知识图谱,并基于优化知识图谱进行社区划分,回写知识图谱确定模糊团体归属,提高了数据复用性和分析效率,使犯罪团伙划分更为准确。划分更为准确。划分更为准确。

【技术实现步骤摘要】
一种基于优化知识图谱的犯罪团伙挖掘分析方法


[0001]本专利技术属于数据挖掘领域,具体涉及一种基于优化知识图谱的犯罪团伙挖掘分析方法。

技术介绍

[0002]当前社会一些犯罪行为呈现团伙性、组织性、预谋性发展趋势。特点是:(1)团伙组织成员具有近习性、纠合性和流动性等特点;(2)组织形式严谨,有固定的团伙头目和骨干成员;(3)有周密的犯罪预谋和犯罪目标,其活动具有组织性、突发性、地域性、数罪并犯等特点。
[0003]犯罪团伙挖掘分析作为一种用于发现网络或图形中团体、群体或社区结构的算法和方法,通常在使用过程中会存在一些限制,比如数据质量较低,可能导致挖掘结果不准确或不完整;
[0004]大规模数据挖掘性能瓶颈,网络规模的增加需要处理大量的数据和计算,这可能导致算法效率低下和计算时间长;分析结果解释有限,通常只能提供关于团伙成员的统计信息,但并不能提供关于成员之间具体联系的深入信息;团伙划分模糊,团伙挖掘分析的结果可能存在模糊性,即某些节点可能同时属于多个团伙,存在不确定性等问题。因此准确预处理数据,合理分类分析数据,确定模糊节点归属团伙,高效挖掘分析数据并展示内在关联是团伙挖掘分析应用中需要克服的难点。
[0005]知识图谱是可用于表示和存储知识的图形化数据结构,可以将实体、属性和关系组织成一个统一的框架,为知识的表达和推理提供基础。我们可以利用犯罪团伙成员的社交网络、物流网络、交通网络等,在知识图谱的数据结构、图论方法基础上对网络中的节点和边进行分析,从而揭示犯罪团伙网络中的关联关系和结构。同时我们还可以对知识图谱中实体和关系使用聚类、分类、关联挖掘等数据挖掘技术将相互关联、具有一定意义的节点分为一组,形成一个个团伙,并以可视化的方式展示其中的团伙结构和关系,从而更好地理解并更新知识图谱中的犯罪关系,对犯罪团伙的挖掘分析可以广泛应用于涉毒、跨境赌博等知识图谱专题,以帮助公安客户快速定位目标群体进行研判。
[0006]目前的基于知识图谱的社区划分方法通常直接导入相关节点数据和边数据,对于犯罪专题知识图谱来说,可用实体和从属关系复杂,具有数据量大、维度高的特点,导致算法效率低下,计算开销大。此外,现有社区划分技术通常对于基于上述知识图谱的划分结果解释有限、团伙划分模糊,某些节点可能同时属于多个团伙,存在不确定性等问题。

技术实现思路

[0007]本专利技术的目的是缩小现有技术中犯罪专题知识图谱规模,提高分析效率,并基于优化知识图谱进行社区划分,回写知识图谱确定模糊团体归属。
[0008]为此,本专利技术提供一种基于优化知识图谱的犯罪团伙挖掘分析方法,包括以下步骤:
[0009]S1、导入数据并构建专题知识图谱;
[0010]S2、根据专题知识图谱获取分布式计算图谱;
[0011]S3、对分布式计算图谱进行连通计算,得到高密度连接的社区子图;
[0012]S4、将社区子图进行过滤优化,缩小子图规模,构建基础信息计算图谱;
[0013]S5、通过社区划分算法对基础信息计算图谱节点进行社区划分,得到社区划分结果集,生成对应标签信息。
[0014]具体的,定时迭代S2

S5,统计记录的标签信息,确定基础信息计算图谱中各节点对应的最终标签信息,且将最终的标签信息回写至所述专题知识图谱。
[0015]具体的,还包括步骤S6:将步骤S5中的标签信息回写到专题知识图谱;步骤S7:定时迭代S2

S6,且将每次迭代的专题知识图谱中各节点归属动态展示。
[0016]具体的,定时迭代一定次数后,确定专题知识图谱中各节点对应的最终标签信息。
[0017]具体的,根据所述图分布式内存计算框架接口传参的节点和边类型,读取所述专题知识图谱数据库中所有的初始节点数据和初始边数据,并将各所述初始节点数据集成为初始节点数据集,各所述初始边数据集成为初始边数据集,根据所述初始节点数据集和初始边数据集构建分布式计算图谱。
[0018]具体的,步骤S3中,对所述分布式计算图谱进行连通计算,获得连通图及连通图分量,每个连通图分量为一个连通子图,将每个连通子图视为一个社区子图,社区子图中关联的实体视为社区节点,分配当前社区节点最小id作为连通图分量编号。
[0019]具体的,所述步骤S4中优化子图的具体方法如下:
[0020]S41、读取重点人员数据,构建重点人员数据集;
[0021]S42、将所述社区节点数据集与重点人员数据集关联,得到重点人员所在的社区子图的连通图分量编号集合;
[0022]S43、将连通图分量编号集合关联所述社区子图,得到潜在社区,构建潜在社区节点数据集;
[0023]S44、将潜在社区节点数据集与所述社区边数据集关联,过滤得到和重点人员关联的潜在边数据集;
[0024]S45、对所述潜在边数据集设置边权重属性,结合所述潜在社区节点构建基础信息计算图谱。
[0025]具体的,步骤S5中采用louvain算法模型,基于所述基础信息计算图谱进行社区划分,通过遍历基础信息计算图谱的节点,合并节点与其邻居社区至模块度增益最大,再将社区合并为一个节点重复上述过程,不断迭代至模块度最大且不再发生变化,得到社区划分结果集。
[0026]具体的,采用分层louvain算法优化所述louvain算法模型的迭代过程,可视化每次迭代的模块度,当模块度不再发生变化时,取当次对应的迭代结果得到优化后的社区划分结果集,并生成对应的标签信息。
[0027]本专利技术还提供一种基于优化知识图谱的犯罪团伙挖掘分析系统,包括:
[0028]数据采集模块,用于采集数据并构建专题知识图谱;
[0029]数据预处理模块,用于根据所述数据采集模块构建的专题知识图谱获取分布式计算图谱,且对分布式计算图谱进行连通计算,得到高密度连接的社区子图,将社区子图进行
过滤优化,缩小子图规模,构建基础信息计算图谱;
[0030]数据分析模块,用于通过社区划分算法对基础信息计算图谱节点进行社区划分,得到社区划分结果集,生成对应标签信息。
[0031]与现有技术相比,本专利技术具有以下优点和有益效果:
[0032]本专利技术提供的这种基于优化知识图谱中一些关键实体和关系数据进行挖掘分析,通过以下方法能较大提升挖掘分析结果的准确性及效率:
[0033]1.基于知识图谱数据进行挖掘分析,导入到知识图谱的数据先进行了清洗处理,数据结构清晰,数据质量可靠,数据复用性高。
[0034]2.基于图分布式内存计算框架,能对接且快速导入多种图数据库中存储的知识图谱数据并进行挖掘分析,更加稳定、高效。
[0035]3.挖掘分析结果通过知识图谱展示,可进一步探索团伙及成员相关的实体关系,更直观深入。
[0036]4.综合标签信息记录历史,团伙社区划分更精确。
[0037]以下将结合附图对本专利技术做进一步详细说明。
附图说明
[0038本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于优化知识图谱的犯罪团伙挖掘分析方法,其特征在于,包括以下步骤:S1、导入数据并构建专题知识图谱;S2、根据专题知识图谱获取分布式计算图谱;S3、对分布式计算图谱进行连通计算,得到高密度连接的社区子图;S4、将社区子图进行过滤优化,缩小子图规模,构建基础信息计算图谱;S5、通过社区划分算法对基础信息计算图谱节点进行社区划分,得到社区划分结果集,生成对应标签信息。2.如权利要求1所述的基于优化知识图谱的犯罪团伙挖掘分析方法,其特征在于,定时迭代S1

S5,统计记录的标签信息,确定基础信息计算图谱中各节点对应的最终标签信息,且将最终的标签信息回写至所述专题知识图谱。3.如权利要求1所述的基于优化知识图谱的犯罪团伙挖掘分析方法,其特征在于,还包括步骤S6:将步骤S5中的标签信息回写到专题知识图谱;步骤S7:定时迭代S1

S6,且将每次迭代的专题知识图谱中各节点的归属动态展示。4.如权利要求3所述的基于优化知识图谱的犯罪团伙挖掘分析方法,其特征在于,定时迭代一定次数后,确定专题知识图谱中各节点对应的最终标签信息。5.如权利要求1所述的基于优化知识图谱的犯罪团伙挖掘分析方法,其特征在于,根据所述图分布式内存计算框架接口传参的节点和边类型,读取所述专题知识图谱数据库中所有的初始节点数据和初始边数据,并将各所述初始节点数据集成为初始节点数据集,各所述初始边数据集成为初始边数据集,根据所述初始节点数据集和初始边数据集构建分布式计算图谱。6.如权利要求5所述的基于优化知识图谱的犯罪团伙挖掘分析方法,其特征在于,所述步骤S3中,对所述分布式计算图谱进行连通计算,获得连通图及连通图分量,每个连通图分量为一个连通子图,将每个连通子图视为一个社区子图,社区子图中关联的实体视为社区节点,分配当前社区节点最小id作为连...

【专利技术属性】
技术研发人员:李辰贺珊张龙涛杨光吕峰
申请(专利权)人:武汉众智数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1