智能语义串并分析方法及系统技术方案

技术编号:23558609 阅读:69 留言:0更新日期:2020-03-25 04:06
本发明专利技术公开了一种智能语义串并分析方法,以用户实际业务需求为指引,以案件串并业务为切入点,以大数据、云计算为技术,以智能化精准串并为目的,通过整合调优多种数据挖掘算法,结合自动化处理而形成,该方法处理过程主要包括数据读取、语义识别、标签转换、案件打标、标签比对、关联度运算、串并案生成、串并推送及提醒的步骤。本发明专利技术应用于公共安全行业刑事侦查工作中,能够从大量案件文本数据中提取特征要素,并将含有相似要素的案件结合关联度自动关联串并起来,减轻了民警手动研判串并工作量,降低了人手串并难度,辅助民警快速精准识别关联案件。

Intelligent semantic string and parallel analysis method and system

【技术实现步骤摘要】
智能语义串并分析方法及系统
本专利技术涉及信息处理
,特别是一种信息分析方法及系统。
技术介绍
公共安全行业领域中,接到群众报警后,民警在出警阶段,会根据现场勘查工作结果对案情通过自然语言进行详细描述说明,后续该警情转案件后,需要把案情描述转为结构化数据,对案件进行标签化处理,才能在案件侦办过程中进行深度自动研判关联,自动进行精准案件串并。当前市面存在五花八门的语义识别软件,由于缺乏机器学习技术或训练不足而识别不准,并且识别后没有提供相应智能算法计算案件关联度,导致最终生成的案件串并仍需用户进行较多的手工干预。
技术实现思路
本专利技术需要解决的技术问题是提供一种智能语义串并分析方法及系统,能够实现案件的精准串并,减轻民警人工识别要素特征的工作量。为解决上述技术问题,本专利技术所采取的技术方案如下。智能语义串并分析方法,具体包括以下步骤:A.梳理历史同类案件特征集合并作分类处理,构建类案标签体系;B.建立历史案件语料库以及专家提取特征经验库形成语料库;C.将历史经验数据注入侵财类案件模型进行训练;D.输入新案件信息,通过侵财类案件模型运行识别案件要素特征;E.融合类案标签体系对案件进行标签化处理;F.定义关联度模型、案件标签权重以及关联匹配标准;G.通过关联度模型计算新案件关联度,关联度高的案件推荐为候选串并案件;H.将关联度运算结果结合用户自定义规则生成串并案件,发送给目标用户中心。上述智能语义串并分析方法,步骤F中所述类案标签体系是根据刑事侦查工作经验对侵财类案件的常见作案特征进行梳理,形成案件特征集合,并根据具体不同的案件类型对案件特征进行分级分类,形成标准化的类案案件标签。上述智能语义串并分析方法,步骤C中所述的侵财类案件模型的训练方法为:采用Tensorflow人工智能可视化数据流编程框架,利用bi-lstm及crf机器学习算法学习大量的历史案件语料并吸取相关要素特征的提取经验;通过定期读取新发案件数据的各个关键属性,辅助案件定性,然后读取这些案件中通过人工确认或修改过的案件特征标签,并将这些信息注入训练库作为案例并加以学习训练。上述智能语义串并分析方法,步骤D中所述的案件要素特征包括作案手段、作案时机、作案区域。上述智能语义串并分析方法,步骤G中所述新案件关联度的计算方法为:对所有标签进行分类处理,并调整设置相应的权重,采用文本关联度算法,将案件标签、权重因子注入算法,以单案为主线与案件库中所有案件进行关联度运算,运算结果以关联度分值倒序罗列。一种智能语义串并分析系统,包括标签体系模块、数据读取模块、语义分析模块、关联度模块、串并模块以及信息展示模块;所述标签体系模块,用于集合历史同类案件特征并做分类处理,对每类特征进行设定相应的标签定义,并对各个标签进行管理;还用于对新发案件进行标签化处理;数据读取模块,用于读取历史以及新法案请、笔录数据和线索数据等非结构化文本数据;语义分析模块,用于对读入的数据进行分析,建立语料库和经验库;能够对语义分析模块中的侵财类案件模型进行训练,并采用训练后的侵财类案件模型对新发案件进行要素特征的提取;关联度模块,用于利用标签体系模块中的标签类别进行比对,并利用案件标签权重进行案件的加权关联度运算,得出关联度队列;串并模块,用于设定关联度阈值和串并条件,根据关联度模块计算的数值进行串并案处理;信息展示模块,用于将串并模块得出的结论向用户进行展示。由于采用了以上技术方案,本专利技术所取得技术进步如下。本专利技术应用于公共安全行业刑事侦查工作中,用于对案件信息进行研判,是基于语义识别技术自动从案情里提取案件特征要素,实现案件的签标化处理,并通过计算案件关联系,研判案件与案件之间的紧密联系,然后将含有相似要素的案件结合关联度自动关联串并起来,减轻了民警手动研判串并工作量,降低了人手串并难度,辅助民警快速精准识别关联案件。附图说明图1为本专利技术的流程图;图2为本专利技术的总体架构图。具体实施方式下面将结合附图和具体实施例对本专利技术进行进一步详细说明。一种智能语义串并分析方法,以用户实际业务需求为指引,以案件串并业务为切入点,以大数据、云计算为技术,以智能化精准串并为目的,通过整合调优多种数据挖掘算法,结合自动化处理而形成,主要包括数据读取、语义识别、标签转换、案件打标、标签比对、关联度运算、串并案生成、串并推送及提醒,具体包括以下步骤。A.梳理历史同类案件特征集合并作分类处理,构建类案标签体系。本步骤中所述的案件标签是根据刑事侦查工作经验对侵财类案件的常见作案特征进行梳理,形成案件特征集合,并根据具体不同的案件类型对案件特征进行分级分类;然后再形成标准化的类案案件标签,并为标签定义同义词、近义词库,从而构建类案标签体系。具体实现时,通过向bi-lstm算法注入单字基础上再注入分词,并结合crf算法限定案件特征的识别结果,最终转化为既定的案件标签。B.建立历史案件语料库以及专家提取特征经验库,形成训练库。通过采集历史案件的案情、笔录数据以及线索数据等非结构化文本数据,进行历史案件语料库的建立,以及吸取历史案件相关要素特征的提取经验,进行专家特征经验库的建立。C.将以上步骤B的历史经验数据注入侵财类案件模型进行训练。本步骤中所述的侵财类案件模型是指:侵财类案件特征识别模型是基于语义识别算法(bi-lstm及crf)并融合侵财类类案标签体系而构建的模型,其采用Tensorflow人工智能可视化数据流编程框架,利用bi-lstm及crf机器学习算法学习大量的历史案件语料并吸取相关要素特征的提取经验,从而得到不断优化的侵财类案件模型。侵财类案件模型在使用过程中,可定期进行自身技能的提升,具体方法为:通过定期读取新发案件数据的各个关键属性,辅助案件定性,然后读取这些案件中通过人工确认或修改过的案件特征标签,并将这些信息注入本专利技术中的训练库作为案例并加以学习训练,从而巩固提升识别能力,尤其对于含有各种地方性语言描述习惯案件案情中。D.输入新发案件信息,通过侵财类案件模型运行识别案件要素特征。通过步骤C所提及的侵财类案件模型,结合NLP自然语言命名实体快速自动识别当前案件特征要素。案件要素特征包括作案手段、作案时机、作案区域等。E.融合类案标签体系对案件进行标签化处理,并基于标准化的类案标签体系将案件特征要素与案件标签进行自动转换,通过标签处理机制,将标签自动打到相应案件上,实现案件标签化处理。本步骤中所述的案件标签是指步骤A所构建的类案标签体系之中的标签。例如:破锁=暴力开锁=撬锁,最终新发案件便被打上了标签。F.定义关联度模型、案件标签权重以及关联匹配标准。本步骤中所述的关联度模型是指:案件关联度模型作用是把多个同类案件进行关联的模型,是通过案件标签及其权重,以及关联匹配标准等计算因子本文档来自技高网...

【技术保护点】
1.智能语义串并分析方法,其特征在于,具体包括以下步骤:/nA.梳理历史同类案件特征集合并作分类处理,构建类案标签体系;/nB.建立历史案件语料库以及专家提取特征经验库形成语料库;/nC.将历史经验数据注入侵财类案件模型进行训练;/nD.输入新案件信息,通过侵财类案件模型运行识别案件要素特征;/nE.融合类案标签体系对案件进行标签化处理;/nF.定义关联度模型、案件标签权重以及关联匹配标准;/nG.通过关联度模型计算新案件关联度,关联度高的案件推荐为候选串并案件;/nH.将关联度运算结果结合用户自定义规则生成串并案件,发送给目标用户中心。/n

【技术特征摘要】
1.智能语义串并分析方法,其特征在于,具体包括以下步骤:
A.梳理历史同类案件特征集合并作分类处理,构建类案标签体系;
B.建立历史案件语料库以及专家提取特征经验库形成语料库;
C.将历史经验数据注入侵财类案件模型进行训练;
D.输入新案件信息,通过侵财类案件模型运行识别案件要素特征;
E.融合类案标签体系对案件进行标签化处理;
F.定义关联度模型、案件标签权重以及关联匹配标准;
G.通过关联度模型计算新案件关联度,关联度高的案件推荐为候选串并案件;
H.将关联度运算结果结合用户自定义规则生成串并案件,发送给目标用户中心。


2.根据权利要求1所述的智能语义串并分析方法,其特征在于,步骤F中所述类案标签体系是根据刑事侦查工作经验对侵财类案件的常见作案特征进行梳理,形成案件特征集合,并根据具体不同的案件类型对案件特征进行分级分类,形成标准化的类案案件标签。


3.根据权利要求1所述的智能语义串并分析方法,其特征在于,步骤C中所述的侵财类案件模型的训练方法为:采用Tensorflow人工智能可视化数据流编程框架,利用bi-lstm及crf机器学习算法学习大量的历史案件语料并吸取相关要素特征的提取经验;通过定期读取新发案件数据的各个关键属性,辅助案件定性,然后读取这些案件中通过人工确认或修改过的案件特征标签,并将这些信息注入训练库作为案例并加以学习训练。

【专利技术属性】
技术研发人员:苏学武刘怀春林剑明唐飞李建华
申请(专利权)人:珠海市新德汇信息技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1