抽取实体关系图中关键实体的方法、系统和存储介质技术方案

技术编号:27117170 阅读:19 留言:0更新日期:2021-01-25 19:21
抽取实体关系图中关键实体的方法、系统和存储介质,其中所述方法包括:获取包括实体和指向关系的数据资源;根据数据资源创建实体关系图;根据实体关系图计算各个实体间的状态转移概率;由各个实体间的状态转移概率生成实体状态转移概率矩阵;根据实体状态转移概率矩阵,使用链接分析算法计算各个实体的收敛概率;选择收敛概率最大的前预定数目个实体作为关键实体,并按收敛概率由大到小的顺序输出关键实体。本发明专利技术公开的方法由于能够根据所获取的数据资源生成实体关系图,并使用链接分析算法对实体关系图进行分析从而获得关键实体,不需要人工参与,使数据处理和实体关系分析的效率大大提高。率大大提高。率大大提高。

【技术实现步骤摘要】
抽取实体关系图中关键实体的方法、系统和存储介质


[0001]本专利技术涉及公共安全
,具体涉及抽取实体关系图中关键实体的方法、系统和存储介质。

技术介绍

[0002]随着社会的发展,各种各样的通讯方式使人们之间的沟通变得丰富多样,常见的通讯方式包括点对点通讯方式如:电话、短信、QQ、MSN、微信、E-mail等,以及平台式通讯方式如:博客、微博、聊天室、微信聊天群、视频会议等,这些都极大地提高了人们的沟通效率。每个人都可以根据自己的需要在特定时间选择特定的通讯方式与他人进行沟通,而同时这些日新月异的沟通方式也必然会被犯罪分子利用以进行犯罪活动,或者被恐怖分子利用实现彼此间的联络从而进行有组织的恐怖活动。为了及时发现这些犯罪活动的迹象,对各种通讯数据进行分析并构建关系图,进而通过关系图寻找关键人物是公共安全领域常用的手段之一。传统上进行关系分析大部分是通过已知的关联关系实现关系图的绘制,以人工分析为主,如公共安全部门常用的挂图作战的方式。这种方式有很多不足,如人工搜集的数据量较小、数据分析效率较低等,极大地限制了公共安全领域的工作效率。

技术实现思路

[0003]本申请提供一种抽取实体关系图中关键实体的方法、系统和存储介质,以解决人工进行实体关系分析效率低的问题。
[0004]根据第一方面,一种实施例中提供一种抽取实体关系图中关键实体的方法,包括:
[0005]获取包括实体和指向关系的数据资源;
[0006]根据所述数据资源创建实体关系图,所述实体关系图为一有向加权图,其每个节点对应一个实体,每条边对应一个指向关系,边的权值为其所对应的指向关系在所述数据资源中出现的次数;
[0007]根据所述实体关系图计算各个实体间的状态转移概率;
[0008]由所述各个实体间的状态转移概率生成实体状态转移概率矩阵;
[0009]根据所述实体状态转移概率矩阵,使用链接分析算法计算各个实体的收敛概率;
[0010]选择收敛概率最大的前预定数目个实体作为关键实体,并按收敛概率由大到小的顺序输出所述关键实体。
[0011]一种实施例中,所述指向关系包括传输类型,不同传输类型的指向关系对应所述实体关系图中不同的边。
[0012]一种实施例中,所述根据所述实体关系图计算各个实体间的状态转移概率包括:任意一第一实体向一第二实体的状态转移概率为:第一实体指向第二实体的某一传输类型的边的权值与以第一实体为起点的所有该传输类型的边的权值之和的比值。
[0013]一种实施例中,所述根据所述实体关系图计算各个实体间的状态转移概率包括:任意一第一实体向一第二实体的状态转移概率为:第一实体指向第二实体的至少两种传输
类型的边的权值之和与以第一实体为起点的该至少两种传输类型的所有边的权值之和的比值。
[0014]一种实施例中,所述链接分析算法为PageRank算法。
[0015]一种实施例中,所述数据资源为一段时间内的wifi传输数据,每条传输数据包括源地址和目的地址,所述源地址和目的地址为MAC地址;所述实体为MAC地址,所述指向关系为由源地址指向目的地址。
[0016]根据第二方面,一种实施例中提供一种抽取实体关系图中关键实体的系统,包括:
[0017]输入模块,用于获取包括实体和指向关系的数据资源;
[0018]实体关系图创建模块,用于根据所述数据资源创建实体关系图,所述实体关系图为一有向加权图,其每个节点对应一个实体,每条边对应一个指向关系,边的权值为其所对应的指向关系在所述数据资源中出现的次数;
[0019]状态转移概率计算模块,用于根据所述实体关系图计算各个实体间的状态转移概率;
[0020]实体状态转移概率矩阵生成模块,用于根据所述各个实体间的状态转移概率生成实体状态转移概率矩阵;
[0021]链接分析模块,用于根据所述实体状态转移概率矩阵,使用链接分析算法计算各个实体的收敛概率;
[0022]输出模块,用于选择收敛概率最大的前预定数目个实体作为关键实体,并按收敛概率由大到小的顺序输出所述关键实体。
[0023]根据第三方面,一种实施例中提供一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现上述第一方面所述的方法。
[0024]依据上述实施例的抽取实体关系图中关键实体的方法、系统和计算机可读存储介质,能够根据所获取的数据资源生成实体关系图,并使用链接分析算法对实体关系图进行分析从而获得关键实体,不需要人工参与,使数据处理和实体关系分析的效率大大提高。
附图说明
[0025]图1为一种实施例中抽取实体关系图中关键实体的方法流程示意图;
[0026]图2为一种实施例中所创建的实体关系图;
[0027]图3为另一种实施例中抽取实体关系图中关键实体的方法流程示意图;
[0028]图4为一种实施例中抽取实体关系图中关键实体的系统结构示意图。
具体实施方式
[0029]下面通过具体实施方式结合附图对本专利技术作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
[0030]另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
[0031]本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。而本申请所说“连接”、“联接”,如无特别说明,均包括直接和间接连接(联接)。
[0032]非正常活动成员之间往往采用各种沟通工具进行频繁联系,公共安全部门在跟踪处理时也会利用频繁的沟通信息,对各种可以获取到的沟通数据进行分析,提取出特定的群体。然而传统的分析方式多为人工分析,数据也多为人工搜集,数据量小效率低,因此本专利技术提供一种可在计算机上执行的抽取实体关系图中关键实体的方法,可根据沟通数据创建实体关系图,并使用链接分析的机器学习算法来寻找实体关系图中与其他实体联系密集的实体,以供公共安全领域人员参考。
[0033]请参考图1,如图1所示,本专利技术一种实施例的抽取实体关系图中关键实体的方法包括步骤S101~S106,下面具体说明。
[0034]步骤S101:获取包括实体和指向关系的数据资源本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种抽取实体关系图中关键实体的方法,其特征在于,包括:获取包括实体和指向关系的数据资源;根据所述数据资源创建实体关系图,所述实体关系图为一有向加权图,其每个节点对应一个实体,每条边对应一个指向关系,边的权值为其所对应的指向关系在所述数据资源中出现的次数;根据所述实体关系图计算各个实体间的状态转移概率;由所述各个实体间的状态转移概率生成实体状态转移概率矩阵;根据所述实体状态转移概率矩阵,使用链接分析算法计算各个实体的收敛概率;选择收敛概率最大的前预定数目个实体作为关键实体,并按收敛概率由大到小的顺序输出所述关键实体。2.如权利要求1所述的方法,其特征在于,所述指向关系包括传输类型,不同传输类型的指向关系对应所述实体关系图中不同的边。3.如权利要求2所述的方法,其特征在于,所述根据所述实体关系图计算各个实体间的状态转移概率包括:任意一第一实体向一第二实体的状态转移概率为:第一实体指向第二实体的某一传输类型的边的权值与以第一实体为起点的所有该传输类型的边的权值之和的比值。4.如权利要求2所述的方法,其特征在于,所述根据所述实体关系图计算各个实体间的状态转移概率包括:任意一第一实体向一第二实体的状态转移概率为:第一实体指向第二实体的至少两种传输类型的边的权值之和与以第一实体为起点的该至少两种传输类型的所有边的权值之和的比值。5.如权利要求1所述的方法,其特征在于,所述链接分析算法为PageRank算法。6.如权利要求1所述的方法,其特征在于,所述数据资源为一段时间内的wifi传输数据,每条传输数据包括源地址和目的地址,所述源地址和目的地...

【专利技术属性】
技术研发人员:裴卫斌徐高峰员晓毅关淑菊路旭
申请(专利权)人:南京中兴力维软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1