案件与人员关系分析方法、装置及电子设备制造方法及图纸

技术编号:25479979 阅读:26 留言:0更新日期:2020-09-01 23:01
本发明专利技术提供了一种案件与人员关系分析方法、装置及电子设备,涉及关系分析技术领域,包括获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类。本发明专利技术可以有效降低工作量,提高破案效率。

【技术实现步骤摘要】
案件与人员关系分析方法、装置及电子设备
本专利技术涉及关系分析
,尤其是涉及一种案件与人员关系分析方法、装置及电子设备。
技术介绍
当前,在警务领域,为了锁定案件的犯罪嫌疑人,通常需要警员依靠经验去做大量的调查和推理来确定嫌疑人员,当同一人员或作案同伙多次作案时,虽然案件存在相似相似性,但是警员依旧需要做大量的调查和推理来确定嫌疑人员,造成工作量大,破案时间长的问题。
技术实现思路
本专利技术的目的在于提供了一种案件与人员关系分析方法、装置及电子设备,可以有效降低工作量,提高破案效率。第一方面,本专利技术提供了一种案件与人员关系分析方法,其中,包括:获取人员关系信息,并根据所述人员关系信息建立人员节点序列;基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据所述均值漂移向量得到社区节点信息;基于所述社区节点信息进行案件归类。进一步的,所述根据所述人员关系信息建立人员节点序列的步骤,包括:根据所述边权重建立人员关系图,将所述人员关系图定义为G(V,E),其中,V为节点集合,节点vi∈V在该图中代表第i个人员,E为边集合,e(vi,vj)∈E在该图中表示节点vi和vj之间的边,其实际意义为第i人和第j之间的关系;根据以下算式计算所述边权重:其中,为两个人员之间的行为频次,kr为行为权重,r为行为种类。根据所述节点集合中的一个节点s1为起点,基于上述边权重计算采用概率,进行随机游走,生成一条节点序列,记为S={s1,s2,...,sn},si∈V,采用概率公式为:其中,st和st-1分别代表当前时刻和上一时刻的节点,其物理意义为上一时刻节点为v的情况下,当前节点选择u的概率。进一步的,对序列进行滑动得到一个固定长度的窗口,并构建该窗口的条件概率函数,包括:对序列S以2w+1为窗口长度进行遍历,每次迭代过程中可以得到一个以节点si为中心的窗口W(i),其中中心节点si∈S,窗口W(i)=S[i-w:i+w];基于所述窗口W(i)建立概率公式,其中,所述概率公式的计算算式为:其中,si是窗口中心节点,sk是窗口W(i)内除si外的任意节点,P(sk|si)为一个softmax函数,代表si和sk同时出现在一个窗口内的概率,具体计算式为:其中,vj表示V中的任一节点,f(si)表示输入节点si的嵌入向量。进一步的,对所述概率公式进行训练得到向量模型的步骤,包括:对所述概率公式使用对数似然函数作为目标函数,并进行求和得到序列中所有窗口的总目标函数值,以最大化节点序列出现的概率,所述总目标函数值的计算算式为:其中,P(W(i)丨si)为单个窗口内部的概率函数,S为窗口节点序列;将所述总目标函数值的映射节点转化为映射向量;对所述映射向量进行学习得到所述向量模型。进一步的,所述基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量的步骤,包括:在所述人员嵌入向量中选择一个初始质心,并建立核函数和核函数带宽,其中,所述核函数的计算算式为:其中,h为核函数带宽,x和x1分别代表质心的位置坐标和另一输入节点的向量坐标,为根据质心坐标和输入节点计算得到的核函数;根据所述核函数建立均值漂移向量计算算式,其中,所述均值漂移向量计算算式为:其中,a(x)为均值漂移向量,其物理意义为当前位置下质心的移动方向和距离,f(v)为人员嵌入向量,为核函数,h为核函数带宽,x为当前质心的坐标向量;经过多次迭代收敛后,所有人员向量将被聚类为多个簇,每个簇代表一个社区节点,簇的质心即社区节点的中心向量。进一步的,所述基于所述社区节点信息进行案件归类的步骤,还包括:从人员与社区关系、人员与案件关系中,跳过人员构建案件与社区的异构图;基于二阶关系查找,将所有连接相同社区节点的案件进行归类汇总。第二方面,本专利技术提供了一种案件与人员关系分析装置,其中,包括:获取单元,用于获取人员关系信息,并根据所述人员关系信息建立人员节点序列;概率函数单元,用于基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;训练单元,用于对概率公式进行训练得到人员嵌入向量;聚类单元,用于基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;社区节点信息单元,用于根据所述均值漂移向量得到社区节点信息;案件归类单元,用于基于所述社区节点信息进行案件归类。第三方面,本专利技术提供了一种电子设备,其中,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现第一方面所述的案件与人员关系分析方法的步骤。第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器运行时执行第一方面所述的案件与人员关系分析方法的步骤。本专利技术实施例带来了以下有益效果:本专利技术提供了一种案件与人员关系分析方法、装置及电子设备,通过获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类。在本实施例提供的上述方式中,通过获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类,实现了自动分析案件与人员之间的关系,避免了当同一人员或作案同伙多次作案时,虽然案件存在相似相似性,但是警员依旧需要做大量的调查和推理来确定嫌疑人员,造成工作量大,破案时间长的问题,可以有效降低工作量,提高破案效率。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的案件与人员关系分析方法流程图;图2为本专利技术实施例一提供的人员节点序列计算方法流程图;图3为本专利技术实施例二提供的案件与人员关系分析装置示意图;图4为本专利技术实施例供的电子设备的结构示意图。图标:301-获取单元;302-概率函数单元;303-训练单元;3本文档来自技高网...

【技术保护点】
1.一种案件与人员关系分析方法,其特征在于,包括:/n获取人员关系信息,并根据所述人员关系信息建立人员节点序列;/n基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;/n对概率公式进行训练得到人员嵌入向量;/n基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;/n根据所述均值漂移向量得到社区节点信息;/n基于所述社区节点信息进行案件归类。/n

【技术特征摘要】
1.一种案件与人员关系分析方法,其特征在于,包括:
获取人员关系信息,并根据所述人员关系信息建立人员节点序列;
基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;
对概率公式进行训练得到人员嵌入向量;
基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;
根据所述均值漂移向量得到社区节点信息;
基于所述社区节点信息进行案件归类。


2.根据权利要求1所述的方法,其特征在于,所述根据所述人员关系信息建立人员节点序列的步骤,包括:
根据边权重建立人员关系图,将所述人员关系图定义为G(V,E),其中,V为节点集合,节点vi∈V在所述人员关系图中代表第i个人员,E为边集合,e(vi,vj)∈E在所述人员关系图中表示节点vi和vj之间的边,其实际意义为第i人和第j之间的关系;
根据以下算式计算所述边权重:



其中,为两个人员之间的行为频次,kr为行为权重,r为行为种类;
根据所述节点集合中的一个节点s1为起点,基于上述边权重计算采用概率,进行随机游走,生成一条节点序列,记为S={s1,s2,...,sn},si∈V,采用概率公式为:



其中,st和st-1分别代表当前时刻和上一时刻的节点,其物理意义为上一时刻节点为v的情况下,当前节点选择u的概率。


3.根据权利要求1所述的方法,其特征在于,对序列进行滑动得到一个固定长度的窗口,并构建该窗口的条件概率函数,包括:
对序列S以2w+1为窗口长度进行遍历,每次迭代过程中可以得到一个以节点si为中心的窗口W(i),其中中心节点si∈S,窗口W(i)=S[i-w:i+w];
基于所述窗口W(i)建立概率公式,其中,所述概率公式的计算算式为:



其中,si是窗口中心节点,sk是窗口W(i)内除si外的任意节点,P(sk|si)为一个softmax函数,代表si和sk同时出现在一个窗口内的概率,具体计算式为:



其中,vj表示V中的任一节点,f(si)表示输入节点si的嵌入向量。


4.根据权利要求3所述的方法,其特征在于,对所述概率公式进行训练得到向量模型的步骤,包括:
对所述概率公式使用对数似然函数作为目标函数,并进行求和得到序列中所有窗口的总目标函数值,以最大化节点序列出现的概率,所述总目标函数值的计算算式为:
<...

【专利技术属性】
技术研发人员:陆韵李冰郑申俊陆克贤王魁储宇晗翁漂洋
申请(专利权)人:杭州中奥科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1