一种智能警情督导处理系统及方法技术方案

技术编号:22022347 阅读:18 留言:0更新日期:2019-09-04 01:18
本发明专利技术公开了一种智能警情督导处理系统及方法,属于语义识别领域,所述系统包括警情语义输入单元、警情训练生成模型单元、法律法规语义检索单元、警情分类检索单元和警情分类及处理法律集显示单元。通过本发明专利技术能够指导或自动纠正相关的警情归类错误,实现更准确的案件归类上报,在文档语义层面实现了相关警情的法律法规的推送督导。本发明专利技术还针对警情领域中存在的语料不平衡情况提取了一种特定领域同义词表生成方法和语料增广,从而提升了语议分析理解的准确率,提升了警情的归类的规范性。

An Intelligent Police Monitoring and Processing System and Method

【技术实现步骤摘要】
一种智能警情督导处理系统及方法
本专利技术涉及语义识别领域,尤其涉及一种智能警情督导处理系统及方法。
技术介绍
随着人工智能、自然语言处理技术的不断发展,以及警用领域数据的不断丰富,建设智能化指挥系统要求实现警情的智能处理分析,如何实现警情的智能督导成为了现阶段的一种挑战。在传统的警司督导模式下,督导人员90%的时间在手动核查非规范化的结构数据上,难以依据现有的法律法规进行规范化处理归档。基于人工智能、自然语言处理的警情智能督导模型成为了有效手段。目前常见的自然语言处理的语义模型需要在较好的平衡的语料上进学习的,要花费大量的人力要对语料进行充分的整理,然而在警情领域大案,要案数是非常少的,语料非常不平衡,而这类警情的处理又是重中之重。针对警情领域的语料不平衡这一问题,提出了相关的语料增广方法以自动生成平衡的警情语料。尽管很多机器学习,自然语言处理模型已经能在语义识别上的研究已经取得了不少成果,但仍然缺少对特定领域应用性研究,本专利技术针对警情领域进行了特定的研究,实现了句子层面的语义向量编码,警情的自动分类以及相关法律法规的语义匹配,从面实现警情智能化督导。
技术实现思路
本专利技术的目的在于提供一种智能警情督导处理系统及方法,以解决现有警情预判语料不平衡的技术问题。一种智能警情督导处理系统,包括警情语义输入单元、警情训练生成模型单元、法律法规语义检索单元、警情分类检索单元和警情分类及处理法律集显示单元,所述警情语义输入单元与警情训练生成模型单元连接,所述警情训练生成模型单元分别与法律法规语义检索单元和警情分类检索单元连接,所述警情分类及处理法律集显示单元分别与法律法规语义检索单元和警情分类检索单元的输出端连接,所述警情语义输入单元用于供接警电话输入警情语义,并提取警情语义中的定长字符输入警情训练生成模型单元和法律法规语义检索单元,所述警情训练生成模型单元用于把增广数据输入到深度神经网络模型进行训练,生成相关的表示语义句子向量模型和警情分类模型,句子向量模型对警情语义中的定长字符进行句向量处理得到警情语义句向量,警情分类模型对警情语义中的定长字符进行警情分类处理得到警情分类关键字,所述法律法规语义检索单元用于采用句子向量模型获取法律法规的句向量集S,并存在在数据资料库中,将警情语义句向量通过局部敏感hash函数或向量夹角余弦度量对比句向量集S,获取距离小于d的法规集R,所述警情分类检索单元用于警情分类类别作为关键字,检索出数据中相关的出警流程,所述警情分类及处理法律集显示单元用于通过网络协议推送警情分类和法规定集R到执法终端显示,实现处警的规范化。进一步地,所述警情训练生成模型单元包括神经网络训练模型模块、句子向量模型生成模块和警情分类模型模块,所述神经网络训练模型模块分别与句子向量模型生成模块和警情分类模型模块连接,所述神经网络训练模型模块用于以增广数据为输入进行训练生成句子向量模型生成模块和警情分类模型模块,所述句子向量模型生成模块用于对警情语义中的定长字符进行句向量处理得到警情语义句向量,所述警情分类模型模块用于对警情语义中的定长字符进行警情分类处理得到警情分类关键字。进一步地,所述法律法规语义检索单元包括句向量编码生成模块和法律法规语义对比模块,所述句向量编码生成模块和法律法规语义对比模块连接,所述句向量编码生成模块对句向量进行编码生成具有由编码序号的句向量,所述法律法规语义对比模块根据编码序号的句向量进行输入与《中华人民共和国刑法》中的每条法律法规进行对比生成句向量集S,并存在在数据资料库中。进一步地,所述警情分类检索单元包括警情分类存储模块和警情流程检索模块,所述警情分类存储模块与警情流程检索模块连接,所述警情分类存储模块用于汇总警情分类类别的关键字,所述警情流程检索模块用于根据关键字检索出相关的出警流程。一种智能警情督导处理方法,所述方法包括如下步骤:步骤1:生成警情领域同义词表;步骤2:生成公安领域警情语料增广数据;步骤3:把增广数据输入神经网络模型进行训练,生成相关的表示语义句子向量模型和警情分类模型;步骤4:接警人员通过警情语义输入单元输入警情语义,并根据同义词表提取警情语义中的定长字符;步骤5:把警情语义中的定长字符输入句子向量模型和警情分类模型取得表示该警情语义句向量和警情分类类别;步骤6:获取的警情分类类别作为关键字,检索出数据中相关的处警流程;步骤7:使用句子向量模型获取《中华人民共和国刑法》每条法规的句向量集S,并存在在数据资料库中;步骤8:把生成的警情语义句向量通过局部敏感hash函数或向量夹角余弦度量对比句向量集S,获取距离小于d的法规集R;步骤9:通过网络协议推送警情分类和法规定集R到执法终端,实现处警的规范化。进一步地,所述步骤1的具体过程为:步骤1.1:通过互联网获取公开的《中华人民共和国刑法》基本文本语料集D;步骤1.2:使用分词工具对语料集D进行分词,全用尺寸为3,步长为1窗口获得二元语言学训练数据;步骤1.3:将二元语言学训练数据进行Word2Vec模型训练得到词向量表示;步骤1.4:计算每两个词向量vi,vj间的夹角余值作为两个词的相似度,获得相似度量矩阵;步骤1.5:通过度量获取与词vi最邻近的3个词即vi的3个同义词得到警情领域的同义词表。进一步地,所述步骤2的具体过程为:步骤2.1:输入一条警情语料,判断该类语料数量n是否大于等于100条;步骤2.2:如果n小于100,直接采样输出该语料,如果n大于等于100执行下一步。步骤2.3:对输入的语料进行分词,获得该语料情的分词表;步骤2.4:等概率生成[0,1,2,3,4]中的一个随机变量N,如N=0采用同义词替换法该语料情的分词表中的3个单词生成新语料;如N=1在句子中找到一个随机词的随机同义词,将该同义词插入句子中的随机位置生成新语料;如N=2随机选择分词表里的两个单词交换位置生成新语料;如N=3随机删除分词表中的1个单词生成新语料;如N=4直接输出该语料。本专利技术采用了上述技术方案,本专利技术具有以下技术效果:本专利技术能够指导或自动纠正相关的警情归类错误,实现更准确的案件归类上报,在文档语义层面实现了相关警情的法律法规的推送督导,针对警情领域中存在的语料不平衡情况提取了一种特定领域同义词表生成方法和语料增广,从而提升了语议分析理解的准确率,提升了警情的归类的规范性。附图说明图1为本专利技术系统结构框图。图2为本专利技术语料增广处理流程图。图3为本专利技术同义词表生成处理流程图。图4为本专利技术夹角余值的度量矩阵图。图5为本专利技术一级警情分布图。图6为本专利技术二级警情分布图。具体实施方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实施例,对本专利技术进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为了使读者对本专利技术的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以实现本专利技术的这些方面。请参阅图1,本专利技术提供一种智能警情督导处理系统,包括警情语义输入单元、警情训练生成模型单元、法律法规语义检索单元、警情分类检索单元和警情分类及处理法律集显示单元。所述警情语义输入单元与警情训练生成模型单元连接。警情训练生成模型单元分别与法律法规语义检索单元和警情分类检索单元连接。警情分类及处理法律集显本文档来自技高网...

【技术保护点】
1.一种智能警情督导处理系统,其特征在于,包括警情语义输入单元、警情训练生成模型单元、法律法规语义检索单元、警情分类检索单元和警情分类及处理法律集显示单元,所述警情语义输入单元与警情训练生成模型单元连接,所述警情训练生成模型单元分别与法律法规语义检索单元和警情分类检索单元连接,所述警情分类及处理法律集显示单元分别与法律法规语义检索单元和警情分类检索单元的输出端连接,所述警情语义输入单元用于供接警电话输入警情语义,并提取警情语义中的定长字符输入警情训练生成模型单元和法律法规语义检索单元,所述警情训练生成模型单元用于把增广数据输入到深度神经网络模型进行训练,生成相关的表示语义句子向量模型和警情分类模型,句子向量模型对警情语义中的定长字符进行句向量处理得到警情语义句向量,警情分类模型对警情语义中的定长字符进行警情分类处理得到警情分类关键字,所述法律法规语义检索单元用于采用句子向量模型获取法律法规的句向量集S,并存在在数据资料库中,将警情语义句向量通过局部敏感hash函数或向量夹角余弦度量对比句向量集S,获取距离小于d的法规集R,所述警情分类检索单元用于警情分类类别作为关键字,检索出数据中相关的出警流程,所述警情分类及处理法律集显示单元用于通过网络协议推送警情分类和法规定集R到执法终端显示,实现处警的规范化。...

【技术特征摘要】
1.一种智能警情督导处理系统,其特征在于,包括警情语义输入单元、警情训练生成模型单元、法律法规语义检索单元、警情分类检索单元和警情分类及处理法律集显示单元,所述警情语义输入单元与警情训练生成模型单元连接,所述警情训练生成模型单元分别与法律法规语义检索单元和警情分类检索单元连接,所述警情分类及处理法律集显示单元分别与法律法规语义检索单元和警情分类检索单元的输出端连接,所述警情语义输入单元用于供接警电话输入警情语义,并提取警情语义中的定长字符输入警情训练生成模型单元和法律法规语义检索单元,所述警情训练生成模型单元用于把增广数据输入到深度神经网络模型进行训练,生成相关的表示语义句子向量模型和警情分类模型,句子向量模型对警情语义中的定长字符进行句向量处理得到警情语义句向量,警情分类模型对警情语义中的定长字符进行警情分类处理得到警情分类关键字,所述法律法规语义检索单元用于采用句子向量模型获取法律法规的句向量集S,并存在在数据资料库中,将警情语义句向量通过局部敏感hash函数或向量夹角余弦度量对比句向量集S,获取距离小于d的法规集R,所述警情分类检索单元用于警情分类类别作为关键字,检索出数据中相关的出警流程,所述警情分类及处理法律集显示单元用于通过网络协议推送警情分类和法规定集R到执法终端显示,实现处警的规范化。2.根据权利要求1所述的一种智能警情督导处理系统,其特征在于:所述警情训练生成模型单元包括神经网络训练模型模块、句子向量模型生成模块和警情分类模型模块,所述神经网络训练模型模块分别与句子向量模型生成模块和警情分类模型模块连接,所述神经网络训练模型模块用于以增广数据为输入进行训练生成句子向量模型生成模块和警情分类模型模块,所述句子向量模型生成模块用于对警情语义中的定长字符进行句向量处理得到警情语义句向量,所述警情分类模型模块用于对警情语义中的定长字符进行警情分类处理得到警情分类关键字。3.根据权利要求1所述的一种智能警情督导处理系统,其特征在于:所述法律法规语义检索单元包括句向量编码生成模块和法律法规语义对比模块,所述句向量编码生成模块和法律法规语义对比模块连接,所述句向量编码生成模块对句向量进行编码生成具有由编码序号的句向量,所述法律法规语义对比模块根据编码序号的句向量进行输入与《中华人民共和国刑法》中的每条法律法规进行对比生成句向量集S,并存在在数据资料库中。4.根据权利要求1所述的一种智能警情督导处理系统,其特征在于:所述警情分类检索单元包括警...

【专利技术属性】
技术研发人员:文武文勇徐华彬李昌席朱昌业兰腾梁夏菲何宁英
申请(专利权)人:广西南宁市博睿通软件技术有限公司
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1