一种基于深度学习的智能辅助办案方法技术

技术编号:25551105 阅读:28 留言:0更新日期:2020-09-08 18:50
本发明专利技术提供一种基于深度学习的智能辅助办案方法,通过深度学习、自然语言处理技术及大数据技术,实现智能辅助办案,方法包括:步骤1:笔录文本关键内容的提取;步骤2:笔录文本关键内容的重组;步骤3:案件信息的自动填充;步骤4:案件知识图谱的构建。本发明专利技术提供的方法可批量识别笔录信息的文本内容和关键内容,并提取相关的信息数据,完成案件信息的自动填表和知识图谱构建,大大减少人工提取信息的工作量,大幅提高准确率和效率,辅助案件分析。

【技术实现步骤摘要】
一种基于深度学习的智能辅助办案方法
本专利技术涉及公安办案智能化管理的
,尤其是指一种基于深度学习的智能辅助办案方法。
技术介绍
案件办理时,需要登记案件信息,将案情录入案件系统,而案件系统中一个案件的新增至少有几十个必填项,并且这些内容基本上都需要从案件的笔录信息中获取。目前案件信息的登记主要依靠人工进行,由人工研读笔录信息,从中提取关键信息,比如人物、时间、地点、其他要素等。这种依靠人工识别、手动录入的方式存在耗费大量人力、处理效率低、信息录入不规范、易出错的明显问题。当前,公安机关作为司法体系的侦查环节,在提高整体执法规范化建设方面,需要从执法的源头抓起,即从公安基层办案质量抓起,公安基层执法是反映公安机关执法质量和公安执法水平的重要指标。同时,刑事类案件对证据材料的规范性要求越来越严格。从公安案件卷宗来看,笔录占据着举足轻重的地位,在案件侦破的众多环节都会涉及到笔录文书制作,包括询问、讯问、勘验、辨认、听证、调整等等。同时笔录作为证据的一种,也是在诉讼中最容易质疑的证据内容之一。公安信息化建设进入智能化、大数据应用阶段。依托人工智能和公安网海量的大数据资源来更好的为民警在前段办案(如审讯阶段)提供服务也是全国公安信息化建设重点工作。综上,实现笔录信息的识别与提取,并进行标准化、规范化的存储、传输与管理,保障案件证据材料的有效性,加强智能化技术与大数据服务融合,是新的智能化执法办案系统建设需要解决的重要问题,有着广泛的应用场景。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种通过人工智能技术进行笔录材料的内容识别和提取实现案件信息的自动填充和案件知识图谱构建的方法,解决当前依靠人工登记案件信息效率低、不规范、易出错的问题。一种基于深度学习的智能辅助办案方法,通过深度学习、自然语言处理技术及大数据技术,实现辅助办案,方法包括:步骤1:笔录文本关键内容的提取;步骤2:笔录文本关键内容的重组;步骤3:案件信息的自动填充;步骤4:案件知识图谱的构建。优选的,在所述步骤1中,运用深度学习及自然语言处理技术识别出笔录文本的文本内容和关键内容。优选的,所述步骤1包括有以下步骤:步骤A1.通过文本识别技术识别出笔录文本的具体文本内容;步骤A2.将识别出的文本内容,通过词袋模型、TF-IDF算法、支持向量机算法进行文本预处理和信息分类,通过bert+bilistm+crf模型进行命令实体识别,利用分词、词性标注工具进行共指消解,通过句法依存分析进行关系提取,最终提取出结构化的关键业务内容信息。优选的,在所述步骤2中,运用华资数据交换平台、模糊地址匹配技术将提取的笔录文本关键内容进行标准化、规范化和重组,以得到符合业务要求的数据。优选的,所述步骤2包括有以下步骤:步骤B1.将提取的文本关键内容,统一汇集存储至华资数据交换平台,进行数据清洗、数据转换和数据装载,得到符合业务要求的数据;步骤B2.对于地址一类的数据,采用华资模糊地址智能匹配技术,构建地址标准模型,将地址数据进行区域标注,最终转换为标准规范的地址数据格式。优选的,在所述步骤3中,将识别出的业务内容信息自动填充至预设有的表单模板中。优选的,所述步骤3包括有以下步骤:步骤C1.从重组后的数据中筛选出所需的业务内容信息;步骤C2.将所得到的业务内容信息填充至相对应的表单模板中。优选的,在所述步骤4中,通过深度学习和自然语言处理技术从笔录文本中提取关键实体关系数据,构建案件知识图谱。优选的,所述步骤4包括有以下步骤:步骤D1.通过命令实体识别、分词、词性标注、句法依存分析识别出笔录文本信息中的实体、实体之间的关系和实体的属性,形成知识图谱数据;步骤D2.将提取的数据以结构化的格式关联到相关的案件,在华资数据交换平台中,利用图数据库存储案件相关的要素及关系,并形成知识图谱。与现有技术相比,本专利技术的优势在于:通过深度学习算法、自然语言处理技术、大数据技术的内容识别和提取技术,并深度融合实际的业务情况,可批量识别笔录信息的文本内容和关键内容,并提取相关的信息数据,完成案件信息的自动填表和知识图谱构建。这一专利技术可以识别提取笔录信息中的关键业务内容并进行重组,完成案件信息的自动填表登记,大大减少人工提取信息的工作量,大幅提高准确率,还可以通过关键要素的提取构建案件知识图谱,辅助案件分析。附图说明图1一种智能辅助办案方法的组成示意图。图2笔录信息提取环节的流程示意图。图3笔录信息重组环节的流程示意图。图4案件信息自动填充环节的流程示意图。图5案件知识图谱构建环节的流程示意图。图6实例中信息提取结果示意图。图7实例中生成知识图谱示意图。具体实施方式下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参见附图1所示,在本实施例中公开了一种基于深度学习的智能辅助办案方法,特选用公安办案相关的业务情况作为实施例进行详细说明,以便于本领域技术人员的理解。本实施例的智能办案辅助方法,通过深度学习、自然语言处理技术及大数据技术,实现笔录文本关键内容的提取和重组,进而完成案件信息的自动填充、案件知识图谱构建,实现智能化辅助办案。如附图2所示,在本实施例中,在笔录文本的关键信息提取环节,运用深度学习及自然语言处理技术识别出笔录文本的文本内容和关键内容。该环节具体包括有以下步骤:步骤A1.通过文本识别技术识别出笔录文本的具体文本内容;步骤A2.将识别出的文本内容,通过词袋模型、TF-IDF算法、支持向量机算法进行文本预处理和信息分类,通过bert+bilistm+crf模型进行命令实体识别,利用分词、词性标注工具进行共指消解,通过句法依存分析进行关系提取,最终提取出结构化的关键业务内容信息。为了便于理解,例如从某案件的笔录材料中通过文本识别及语义识别识别出该笔录的讯问时间、侦查人员、讯问地址、案发经过与事实等信息作为关键业务内容进行提取。如附图3所示,在本实施例中,在笔录文本的关键信息重组环节,运用华资数据交换平台、地址匹配技术将提取的笔录文本关键内容进行标准化、规范化和重组,以得到符合业务要求的数据。该环节具体包括有以下步骤:步骤B1.将提取的文本关键内容,统一汇集存储至华资数据交换平台,进行数据清洗、数据转换和数据装载,得到符合业务要求的数据;步骤B2.对于地址一类的数据,采用华资模糊地址智能匹配技术,构建地址标准模型,将地址数据进行区域标注,最终转换为标准规范的地址数据格式。为了便于理解,例如从笔录材料中提取的关键信息中包含的犯人信息有“身份证号:44111119901228****”、“初中毕业”、“住在安化县纱帽村*号”这三项信息,将此信息汇集至华资数据交换平台,对身份证号的出生日期“19901228”进行标准化转换,得到犯人的出生日期为“1990年12月28日”,本文档来自技高网...

【技术保护点】
1.一种基于深度学习的智能辅助办案方法,其特征在于:通过深度学习、自然语言处理技术及大数据技术,实现辅助办案,所述办案方法包括如下步骤:/n步骤1:笔录文本关键内容的提取;在所述步骤1中,运用深度学习及自然语言处理技术识别出笔录文本的文本内容和关键内容;/n所述步骤1包括有以下步骤:/n步骤A1.通过文本识别技术识别出笔录文本的具体文本内容;/n步骤A2.将识别出的文本内容,通过词袋模型、TF-IDF算法、支持向量机算法进行文本预处理和信息分类,通过bert+bilistm+crf模型进行命令实体识别,利用分词、词性标注工具进行共指消解,通过句法依存分析进行关系提取,最终提取出结构化的关键业务内容信息;/n步骤2:笔录文本关键内容的重组;/n步骤3:案件信息的自动填充;/n步骤4:案件知识图谱的构建。/n

【技术特征摘要】
1.一种基于深度学习的智能辅助办案方法,其特征在于:通过深度学习、自然语言处理技术及大数据技术,实现辅助办案,所述办案方法包括如下步骤:
步骤1:笔录文本关键内容的提取;在所述步骤1中,运用深度学习及自然语言处理技术识别出笔录文本的文本内容和关键内容;
所述步骤1包括有以下步骤:
步骤A1.通过文本识别技术识别出笔录文本的具体文本内容;
步骤A2.将识别出的文本内容,通过词袋模型、TF-IDF算法、支持向量机算法进行文本预处理和信息分类,通过bert+bilistm+crf模型进行命令实体识别,利用分词、词性标注工具进行共指消解,通过句法依存分析进行关系提取,最终提取出结构化的关键业务内容信息;
步骤2:笔录文本关键内容的重组;
步骤3:案件信息的自动填充;
步骤4:案件知识图谱的构建。


2.根据权利要求1所述的一种基于深度学习的智能辅助办案方法,其特征在于:在所述步骤2中,运用华资数据交换平台、模糊地址匹配技术将提取的笔录文本关键业务内容进行标准化、规范化和重组,以得到符合业务要求的数据。


3.根据权利要求2所述的一种基于深度学习的智能辅助办案方法,其特征在于:所述步骤2包括有以下步骤:
步骤B1.将提取的文本关键内容,统一汇集存储至华资数据交换平台,进行数据清洗、数据转...

【专利技术属性】
技术研发人员:彭本夏元松张士松李婷纪梦兰雷邦宁翁庄明于秀兵黄志飞韦建文
申请(专利权)人:广州华资软件技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1