基于警情间语义相似度判断串并案的方法及装置制造方法及图纸

技术编号:29791047 阅读:19 留言:0更新日期:2021-08-24 18:10
本发明专利技术实施例提供了一种基于警情间语义相似度判断串并案的方法及装置,该方法包括借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;利用公安警情词向量,计算警情之间的相似度;将所述相似度大于第一阈值的多个警情辅助判断为串并案。

【技术实现步骤摘要】
基于警情间语义相似度判断串并案的方法及装置
本专利技术涉及公安管理领域,特别是涉及一种基于警情间语义相似度判断串并案的方法及装置。
技术介绍
在公安的案件,有串案和并案两种叫法。串案,就是一系列不同的案件,通过对作案手段、痕迹、物证等分析,发现其存在联系,进而将这些案件放在一起侦破。并案,是指两个不同的案件,通过作案手段、痕迹、物证,发现其存在联系,而将两个案件放在一起侦破。现有技术中对串案和并案的处理方式,是通过人的经验来对作案手段、痕迹、物证等已有的数据进行分析,来确定案件之间是否串案或并案处理。其缺点是,串案和并案全部依赖的是个人的经验,没有系统支撑,另外面对海量的警情,很难有效的找到串并案警情,并且存在一定错误率。
技术实现思路
本专利技术的目的是克服现有技术中的不足之处,提供一种基于警情间语义相似度判断串并案的方法及装置。为实现上述目的,本专利技术一方面提供一种基于警情间的语义相似度辅助判断串并案的方法,包括:借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;利用公安警情词向量,计算警情之间的相似度;将所述相似度大于第一阈值的多个警情辅助判断为串并案。优选地,所述利用公安警情词向量,计算警情之间的相似度包括:使用余弦相似度,计算警情的公安警情词向量之间的相似度,确定警情之间的相似度。本专利技术另一方面还提供一种基于综合相似度辅助判断串并案的方法,包括:基于警情间的融合路径权重相似度计算警情间的第一类型相似度;基于警情间的语义相似度计算警情间的第二类型相似度;基于专家规则计算警情间的第三类型相似度;基于第一类型相似度、第二类型相似度和第三类型相似度,辅助判断警情之间是否为串并案;其中,基于警情间的语义相似度计算警情间的第二类型相似度包括:借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;利用公安警情词向量,计算警情之间的第二类型相似度。本专利技术再一方面还提供一种计算机,包括处理器和存储器,所述处理器用于执行存储器中存储的指令以执行如下步骤:借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;利用公安警情词向量,计算警情之间的相似度;将所述相似度大于第一阈值的多个警情辅助判断为串并案。本专利技术再一方面还提供一种计算机,包括处理器和存储器,所述处理器用于执行存储器中存储的指令以执行如下步骤:基于警情间的融合路径权重相似度计算警情间的第一类型相似度;基于警情间的语义相似度计算警情间的第二类型相似度;基于专家规则计算警情间的第三类型相似度;基于第一类型相似度、第二类型相似度和第三类型相似度,辅助判断警情之间是否为串并案;其中,基于警情间的语义相似度计算警情间的第二类型相似度包括:借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;利用公安警情词向量,计算警情之间的第二类型相似度。本实施例提供的技术方案通过实现中警情间的语义近似度确定警情之间的相似度,并以此辅助确定多个警情是否为串并案,极大改善了公安人员的办案效率。本专利技术的其他有益效果将在说明书中进行进一步说明。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例一提供的一种基于警情间的语义相似度辅助判断串并案的方法的流程示意图;图2为本专利技术另一实施例还提供一种基于综合相似度辅助判断串并案的方法的流程示意图;图3是图2中步骤S201的一种具体实现流程图;图4为警情概念本体库的概念层次关系的一个示例示意图;图5是图2中步骤S202的一种具体实现流程图;图6是图2中步骤S203的一种具体实现流程图;图7是警情概念图谱形成的一个具体示例的示意图。具体实施方式为了便于理解本专利技术,下面将参照相关附图对本专利技术进行更全面的描述。附图中给出了本专利技术的较佳实施方式。但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本专利技术的公开内容理解的更加透彻全面。图1示出了本专利技术实施例一提供的一种基于警情间的语义相似度辅助判断串并案的方法的流程示意图,该方法包括:步骤S101:借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量。可以利用利用word2vec算法在公安的警情语料中进行公安领域训练词向量模型。具体地,可以采用word2vec的方法进行词向量模型训练。首先对警情语料进行分词,去除停用词,然后利用one-hot的形式进行表示。模型训练利用CBOW方法来进行模型的训练。输入层为警情上下文单词的one-hot表示。然后对所有的one-hot表示词向量的输入乘以权重矩阵W。然后对所得到的向量相加求平均作为隐层向量,大小为1*N。最后乘以权重矩阵W,得到向量{1*V}激活函数处理得到V-dim概率分布,概率最大的index所指示的单词为预测出的中间词。训练的过程是loss函数最小。通过训练得到了权重矩阵W,词向量的one-hot表示乘以训练得到的权重矩阵W即为公安警情词向量。步骤S102:利用公安警情词向量,计算警情之间的相似度。一种具体的方式是使用余弦相似度,计算警情的公安警情词向量之间的相似度,确定警情之间的相似度。余弦值越大,则相似度越高。步骤S103:将所述相似度大于第一阈值的多个警情辅助判断为串并案。本实施例提供的技术方案通过实现中警情间的语义近似度确定警情之间的相似度,并以此辅助确定多个警情是否为串并案,极大改善了公安人员的办案效率。本专利技术另一实施例还提供一种基于综合相似度辅助判断串并案的方法,参照图2所示,该方法包括:步骤S201:基于警情间的融合路径权重相似度计算警情间的第一类型相似度。其中步骤S201中基于警情间的融合路径权重相似度计算警情间的第一类型相似度,具体可以通过图3示出的流程图实现,包括如下步骤:步骤S301:构建警情知识图谱,所述警情知识图谱将警情转化为结构化知识。警情图谱的目的是为了将警情转化为结构化的知识,让机器可以理解警情,并且发现警情之间的一些关联关系。构建警情图谱首先是构建警情概念本体,然后基于本体进行要素信息抽取,将抽取的要素存储到图数据库构成警情知识图谱,供后续串并案关系发现。具体地,警情概念本体的构建可以基于警情7何要(何时、何地、何事、何人、何因、何物、何果)对警情中涉及到的涉案人员,涉案地址,涉案物品,涉案时间,涉案手段等几大类概念要素进行细分,本文档来自技高网...

【技术保护点】
1.一种基于警情间的语义相似度辅助判断串并案的方法,其特征在于,包括:/n借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;/n利用公安警情词向量,计算警情之间的相似度;/n将所述相似度大于第一阈值的多个警情辅助判断为串并案。/n

【技术特征摘要】
1.一种基于警情间的语义相似度辅助判断串并案的方法,其特征在于,包括:
借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为公安警情词向量;
利用公安警情词向量,计算警情之间的相似度;
将所述相似度大于第一阈值的多个警情辅助判断为串并案。


2.如权利要求1所述的方法,其特征在于,所述利用公安警情词向量,计算警情之间的相似度包括:
使用余弦相似度,计算警情的公安警情词向量之间的相似度,确定警情之间的相似度。


3.一种基于综合相似度辅助判断串并案的方法,其特征在于,包括:
基于警情间的融合路径权重相似度计算警情间的第一类型相似度;
基于警情间的语义相似度计算警情间的第二类型相似度;
基于专家规则计算警情间的第三类型相似度;
基于第一类型相似度、第二类型相似度和第三类型相似度,辅助判断警情之间是否为串并案;
其中,基于警情间的语义相似度计算警情间的第二类型相似度包括:
借助预先训练得到的公安领域训练词向量模型,将计算原始警情信息转化为...

【专利技术属性】
技术研发人员:石庭豪李明洹陈耀玲
申请(专利权)人:苏州智汇谷科技服务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1