一种面向公共安全异构信息网络的可疑组织查询方法技术

技术编号:36865970 阅读:6 留言:0更新日期:2023-03-15 19:08
本发明专利技术涉及一种面向公共安全异构信息网络的可疑组织查询方法。本发明专利技术首先获取公共安全领域的人员关系数据集,根据所述人员关系数据集构建公共安全领域的异构信息网络,然后获取线索可疑人员,根据所述线索可疑人员以元路径对异构信息网络进行遍历,获取与线索可疑人员有关的候选可疑人员集合,然后根据k

【技术实现步骤摘要】
一种面向公共安全异构信息网络的可疑组织查询方法


[0001]本专利技术属于公共安全领域,具体涉及一种面向公共安全异构信息网络的可疑组织查询方法。

技术介绍

[0002]在社交网络中,可疑组织也必然会表现为某种特定结构的社区。随着信息化的推进,积累了越来越多的人员关系网络、人员信息等数据。
[0003]现有可疑组织查询方法大多聚焦于同构信息网络,没有考虑实际应用场景中更为常见的异构信息网络,即网络中的节点和边具有多种不同类型,无法直接部署到异构网络中进行应用。例如,在实际场景中,节点类型往往不止对象一种,还包括事件、案件、地址、单位等等,边的类型包括对象与事件的关系、对象与案件的关系、对象与对象间的关系等等,同构信息网络是无法展示如此多的信息。此外,现有可疑组织查询算法大多仅考虑单一类型属性,例如简单文本属性或者数值型属性,无法同时考虑上述两种类型的属性,影响了查询的质量与精度。

技术实现思路

[0004]基于现有技术中存在的上述缺点和不足,本专利技术在可疑组织查询的过程中引入了元路径的概念,可以直接在异构信息网络中进行可疑组织查询。此外,本专利技术同时考虑了可疑人员的文本型属性和数值型属性,能够找到包含线索可疑人员的结构紧密且属性相似的可疑组织
[0005]为了达到上述专利技术目的,本专利技术采用以下技术方案:
[0006]一种面向公共安全异构信息网络的可疑组织查询方法,包括以下步骤:
[0007]S1,获取公共安全领域的人员关系数据集,
[0008]根据所述人员关系数据集构建公共安全领域的异构信息网络,所述异构信息网络中包含顶点、连接顶点的边、顶点属性;所述顶点包含代表对象、案件、事件三种类型的顶点;所述边用于表示边两端顶点的关系;每个顶点均包含文本型属性以及数值型属性;
[0009]S2,获取线索可疑人员,根据所述线索可疑人员,以元路径对异构信息网络进行遍历,得到候选可疑人员集合,其中所述元路径指的是连接两类顶点的一条特定的路径;
[0010]S3,根据所述候选可疑人员集合生成诱导子图,根据k

core约束,从诱导子图中移除不满足k

core约束条件的候选可疑人员,得到包含所述可疑人员的k

core子图,此时k

core子图的顶点集合为包含所述线索可疑人员的紧密可疑人员集合;
[0011]S4,根据所述紧密可疑人员集合,构建搜索树,所述搜索树记录了所有可能的包含所述线索可疑人员的k

core子图;
[0012]S5,遍历所述搜索树,计算每一个所述k

core子图的属性距离,并选取属性距离最小的子图作为结果返回,返回的子图中的所有顶点集合即为包含所述可疑人员的可疑组织。
[0013]作为优选方案,所述步骤S2具体包括以下步骤:
[0014]S2

1获取到的所述线索可疑人员设为q,所述元路径设为p,初始化待处理队列Q
c
为所述线索可疑人员{q},初始化所述候选可疑人员集合C为线索可疑人员{q},所述待处理队列Q
c
中保存着待遍历的可疑人员;
[0015]S2

2对于任意可疑人员v∈Q
c
,找到所有以可疑人员v为起点通过所述元路径p相连的可疑人员,保存到集合Ψ[v]中,对于Ψ[v]中的任意可疑人员u,若可疑人员u没有被包含在所述候选可疑人员集合C中,则将可疑人员u同时添加到候选可疑人员集合C和待处理队列Q
c
中;重复上述操作直到待处理队列Q
c
为空;
[0016]S2

3所述候选可疑人员集合C中的所有可疑人员构成了与线索可疑人员q相关的所述候选可疑人员集合。
[0017]作为优选方案,所述步骤S4具体包括以下步骤:
[0018]S4

1根据所述紧密可疑人员集合初始化搜索树T,所述搜索树T中的每一个树节点记录一个k

core子图以及该树节点的子节点,初始化搜索树的根节点root记录步骤3中所述候选可疑人员集合所生成的诱导子图H,初始化待构建队列Q为搜索树的根节点{root},所述待构建队列Q中保存着待构建的搜索树节点;
[0019]S4

2对于任意树节点n∈Q,取出树节点n中的子图H,所述子图H中的可疑人员构成的集合记为S,对于可疑人员集合S中的任一可疑人员s,尝试从S中移除s,然后从剩余可疑人员构成的诱导子图中找出仍然满足k

core约束的可疑人员集合如果不为空,创建新的树节点n1并记录树节点n1为树节点n的子节点,树节点n1记录了可疑人员集合所构成的诱导子图,把树节点n1添加到待构建队列Q中;
[0020]S4

3重复步骤S4

2直至待构建队列Q为空,完成搜索树的构建。
[0021]作为优选方案,所述步骤S5中,所述k

core子图的属性距离的计算公式为:v1,v2为子图H中的任意两点,N为子图H中的对象类型顶点数量;其中f(v1,v2)=α*f
t
(v1,v2)+(1

α)*f
n
(v1,v2);其中f
t
(v1,v2)表示可疑人员v1,v2的文本型属性距离,f
n
(v1,v2)表示可疑人员v1,v2的数值型属性距离,α为文本型属性距离和数值型属性举例的权重比值。
[0022]本专利技术与现有技术相比,有益效果是:
[0023]本专利技术在可疑组织查询的过程中同时将异构网络结构信息以及可疑人员属性信息结合起来,并且同时考虑可疑人员的文本型属性和数值型属性,找到包含线索可疑人员的结构紧密且属性相似的可疑组织。
附图说明
[0024]图1是本专利技术实施例的一种面向公共安全异构信息网络的可疑组织查询方法的流程图;
[0025]图2是本专利技术实施例的公共安全异构信息网络示意图;
[0026]图3是本专利技术实施例的一种APA元路径所构成的同构图。
具体实施方式
[0027]为了更清楚地说明本专利技术实施例,下面将对照附图说明本专利技术的具体实施方式。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
[0028]本实施例提供的一种面向公共安全异构信息网络的可疑组织查询方法,其流程图如图1 所示,本实施例中以公共安全领域的部分人员关系数据集举例。
[0029](1)首先进行步骤S1,获取公共安全领域的人员关系数据集,
[0030]根据所述人员关系数据集构建公共安全领域的异构信息网络,所述异构信息网络中包含顶点、连接顶点的边、顶点属性;所述顶点包含对象本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向公共安全异构信息网络的可疑组织查询方法,其特征在于,包括以下步骤:S1,获取公共安全领域的人员关系数据集,根据所述人员关系数据集构建公共安全领域的异构信息网络,所述异构信息网络中包含顶点、连接顶点的边、顶点属性;所述顶点包含代表对象、案件、事件三种类型的顶点;所述边用于表示边两端顶点的关系;每个所述顶点均包含文本型属性以及数值型属性;S2,获取线索可疑人员,根据所述线索可疑人员,以元路径对异构信息网络进行遍历,得到候选可疑人员集合,其中所述元路径指的是连接两类顶点的一条特定的路径;S3,根据所述候选可疑人员集合生成诱导子图,根据k

core约束,从诱导子图中移除不满足k

core约束条件的候选可疑人员,得到包含所述可疑人员的k

core子图,此时k

core子图的顶点集合为包含所述线索可疑人员的紧密可疑人员集合;S4,根据所述紧密可疑人员集合,构建搜索树,所述搜索树记录了所有可能的包含所述线索可疑人员的k

core子图;S5,遍历所述搜索树,计算每一个所述k

core子图的属性距离,并选取属性距离最小的子图作为结果返回,返回的子图中的所有顶点集合即为包含所述可疑人员的可疑组织。2.如权利要求1所述的一种面向公共安全异构信息网络的可疑组织查询方法,其特征在于,所述步骤S2具体包括以下步骤:S2

1获取到的所述线索可疑人员设为q,所述元路径设为p,初始化待处理队列Q
c
为所述线索可疑人员{q},初始化所述候选可疑人员集合C为线索可疑人员{q},所述待处理队列Q
c
中保存着待遍历的可疑人员;S2

2对于任意可疑人员v∈Q
c
,找到所有以可疑人员v为起点通过所述元路径p相连的可疑人员,保存到集合Ψ[v]中,对于Ψ[v]中的任意可疑人员u,若可疑人员u没有被包含在所述候选可疑人员集合C中,则将可疑人员u同时添加到候选可疑人员集合C和待处理队列Q<...

【专利技术属性】
技术研发人员:徐小良曾鑫俊王宇翔
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1