当前位置: 首页 > 专利查询>王小易专利>正文

一种在电子笔录中提取人员信息及关系人的方法技术

技术编号:20448716 阅读:32 留言:0更新日期:2019-02-27 02:52
本发明专利技术公开了一种在电子笔录中提取人员信息及关系人的方法,包括以下步骤:首先对笔录信息进行案件编号对应;然后通过智能识别对笔录类型进行判断,分析同一案件编号下的人员关系;再进行笔录前后部分判断,用于人员基本信息提取及智能识别;接着将笔录信息中的人员信息提取和初步的人员关系对应,进行关系人智能识别,并将相关字符段和对应的字符段内容进行正向人工干预,得到结构型数据库,结构型数据库用于查询分析应用;最后通过反向人工干预在结构型数据库中记录形成一个修改数据库。本发明专利技术的方法可以挖掘现有笔录信息中被闲置的信息,关系人资源大大拓展,信息来源真实可靠。

A Method of Extracting Personnel Information and Relevant Persons in Electronic Records

The invention discloses a method for extracting personnel information and related persons in electronic transcripts, which includes the following steps: firstly, case number correspondence is carried out for the recorded information; secondly, the type of transcripts is judged by intelligent recognition, and the relationship between persons under the same case number is analyzed; secondly, some judgments are made before and after the transcripts for the extraction of basic information and intelligent recognition of personnel; secondly, the pen is used for the extraction of basic information and intelligent recognition of personnel. Personnel information extraction in record information corresponds to the preliminary personnel relationship, and the intelligent recognition of relatives is carried out, and the related character segments and corresponding character segments are intervened forward manually to obtain a structured database, which is used for query and analysis applications. Finally, a modified database is recorded in the structured database through reverse manual intervention. The method of the invention can mine the idle information in the existing record information, greatly expand human resources, and the information source is real and reliable.

【技术实现步骤摘要】
一种在电子笔录中提取人员信息及关系人的方法
本专利技术涉及一种在电子笔录中提取人员信息及关系人的方法。
技术介绍
随着政府部门的信息化的推进,笔录系统等无纸化工具在公安、城管等政府部门普遍应用;即使在没有笔录系统的单位,word、wps等办公软件下的模版化、格式化电子笔录也已普及使用,由此生成了海量的word、wps、PDF等等各类文件类型的电子笔录。电子笔录中不仅记录了笔录对象的基本信息,还记录了笔录对象的家庭情况信息和相关涉案人员等关系人的信息,且人员关系相对明确固定,十分有利于人员关系的拓展。而与此同时,在政府部门的日常管理服务工作中,如公安机关的刑事侦查、治安管理等执法活动中,分析判断关系人以及判定人与人之间关系程度的需求十分迫切,也在户籍、暂住等业务系统中对一些同户人员、同暂住地人员等关系人信息实现了自动梳理,但目前笔录系统中的关系人信息尚不能自动梳理,无法为实际需求提供更有效服务。原因在于电子笔录中人员信息和反映的关系人信息是多以文字描述的形状存在,专业术语称之为“碎片化”、“非结构型数据”,而不是像户籍系统、流动人口管理等专业系统那样形成“关系型数据”或“结构型数据”,因而不能被其他关系人分析软件直接关联予以引用,导致笔录中的信息没有被充分挖掘利用。现实工作中,一方面是在电子笔录在日常工作中累积了大量的人员信息和关系信息,但却没有被充分利用,或被分散在各自的电脑里没有得到整合,另一方面却是同一部门对人员关系的迫切需求。因此,提取电子笔录中的人员信息和关系人信息,整合成一个结构型数据,既可提高对现有基础零散数据的利用,也可提高执法部门的工作效率,为执法部门提供更加有效的服务。
技术实现思路
本专利技术目的在于针对现有技术所存在的不足而提供一种在电子笔录中提取人员信息和关系人信息的方法,将电子笔录中未被利用的人员信息和关系人信息予以挖掘利用,为政府相关部门尤其是公安机关在人员分析,特别是关系人分析方面提供优质服务。为了解决上述技术问题,本专利技术采用如下技术方案:一种在电子笔录中提取人员信息及关系人的方法,其特征在于包括以下步骤:1)首先对笔录信息进行案件编号对应;2)然后通过智能识别对笔录类型进行判断,分析同一案件编号下的人员关系;3)再进行笔录前后部分判断,用于人员基本信息提取及智能识别;4)接着将笔录信息中的人员信息提取和初步的人员关系对应,进行关系人智能识别,并将相关字符段和对应的字符段内容进行正向人工干预,得到结构型数据库,结构型数据库用于查询分析应用;5)最后通过反向人工干预在结构型数据库中记录形成一个修改数据库。进一步,步骤1)中的笔录信息通过电子笔录系统或读取导入电子笔录文件的形式实现。进一步,当接入电子笔录系统时,人员信息和家庭成员信息通过笔录系统的固定格式字符段直接读取,笔录问答内容中的人员信息和关系人信息通过关键词语智能识别字符段、智能语义解析算法判断该字符段对应的内容的方式提取。进一步,当接入读取导入电子笔录文件时,人员信息和家庭成员关系人信息通过关键词语智能识别电子笔录前半部分的字符段、智能语义解析算法判断该字符段对应的内容提取,电子笔录后半部笔录问答内容中的人员信息和关系信息通过关键词语智能识别字符段、智能语义解析算法判断该字符段对应的内容的方式提取。进一步,步骤4)中的相关字符段和对应的字符段内容对应关系不确定时,通过人工核实文字快照预览。进一步,步骤4)中的结构型数据库支持对接查询分析对比系统,为查询分析对比提供服务。进一步,步骤5)中的修改数据库支持浏览者对人员信息和关系人信息的人工修改,修改记录由管理员判定并决定隐藏或显示的功能。本专利技术由于采用了上述技术方案,具有以下有益效果:1、可以挖掘现有笔录信息中被闲置的信息。2、笔录的特性决定了关系人资源大大拓展。3、信息来源真实可靠,笔录均由民警制作,内容均是笔录制作对象亲口交代并签字核实。附图说明下面结合附图对本专利技术作进一步说明:图1为本专利技术一种在电子笔录中提取人员信息及关系人的方法中笔录读取和信息提取的流程图。图中:1-智能识别;2-正向人工干预;3-结构型数据库;4-反向人工干预;5-查询分析应用;6-关系人智能识别;7-修改数据库。具体实施方式如图1所示,为本专利技术一种在电子笔录中提取人员信息及关系人的方法,包括以下步骤:1)首先对笔录信息进行案件编号对应,笔录信息通过电子笔录系统或读取导入电子笔录文件的形式实现;当接入电子笔录系统时,人员信息和家庭成员信息通过笔录系统的固定格式字符段直接读取,笔录问答内容中的人员信息和关系人信息通过关键词语智能识别字符段、智能语义解析算法判断该字符段对应的内容的方式提取;当接入读取导入电子笔录文件时,人员信息和家庭成员关系人信息通过关键词语智能识别电子笔录前半部分的字符段、智能语义解析算法判断该字符段对应的内容提取,电子笔录后半部笔录问答内容中的人员信息和关系信息通过关键词语智能识别字符段、智能语义解析算法判断该字符段对应的内容的方式提取;2)然后通过智能识别1对笔录类型进行判断,分析同一案件编号下的人员关系;3)再进行笔录前后部分判断,用于人员基本信息提取及智能识别;4)接着将笔录信息中的人员信息提取和初步的人员关系对应,进行关系人智能识别6,并将相关字符段和对应的字符段内容进行正向人工干预2,得到结构型数据库3,结构型数据库支持对接查询分析对比系统,为查询分析对比提供服务,结构型数据库用于查询分析应用5,当相关字符段和对应的字符段内容对应关系不确定时,通过人工核实文字快照预览;5)最后通过反向人工干预4在结构型数据库中记录形成一个修改数据库7,修改数据库支持浏览者对人员信息和关系人信息的人工修改,修改记录由管理员判定并决定隐藏或显示的功能。由于电子笔录存在通过笔录系统制作和其他非笔录系统制作两种模式,故将笔录系统的人员信息和关系人信息提取成为系统提取模式(以下称A模式),其他无笔录系统对接的为读取导入电子笔录文件模式(以下称B模式)。一、A模式(系统提取模式)A1笔录的案件编号对应:理论上每起案件均有案件编号,为更好地区分笔录归属,每份电子笔录均应对应案件编号。但是现实中也有大量没有案件编号对应的笔录。所以,有案件编号的笔录,可以通过笔录系统直接提取对应;没有对应案件编号的笔录,可按照“单位代码+制作时间+序列”或其他编号规则赋予案件编号并对应,同一案件中的其他笔录也关联该案件编号;如后期该笔录对应了实际的案件编号,则赋予的案件编号自动替换。A2笔录类型判断:现实工作中,工作人员可能会制作各式各样的笔录,如针对嫌疑人的讯问笔录,针对受害人或证人的询问笔录。可以通过笔录的类型可以判断,因为笔录系统中均有笔录类型选择。笔录类型判断用以分析判断同一案件编号之下的人员关系,如同一案件编号下的多个被讯问人可判断为同案犯或其他不同程度的利害关系人。A3笔录前后部分判断:现行政府部门的笔录基本上有相对固定的格式,如笔录前半部分的抬头、笔录时间、笔录对象基本信息、制作笔录人员信息、单位信息等等,以及笔录后半部分的自由问答部分;前后两部分可以通过固定程序的语言如“我们是***公安机关的民警……”或第一个完整的“问”“答”或其他方式进行区分。A4人员信息读取:在链接笔录系统的情况下,笔录前本文档来自技高网
...

【技术保护点】
1.一种在电子笔录中提取人员信息及关系人的方法,其特征在于包括以下步骤:1)首先对笔录信息进行案件编号对应;2)然后通过智能识别对笔录类型进行判断,分析同一案件编号下的人员关系;3)再进行笔录前后部分判断,用于人员基本信息提取及智能识别;4)接着将笔录信息中的人员信息提取和初步的人员关系对应,进行关系人智能识别,并将相关字符段和对应的字符段内容进行正向人工干预,得到结构型数据库,结构型数据库用于查询分析应用;5)最后通过反向人工干预在结构型数据库中记录形成一个修改数据库。

【技术特征摘要】
1.一种在电子笔录中提取人员信息及关系人的方法,其特征在于包括以下步骤:1)首先对笔录信息进行案件编号对应;2)然后通过智能识别对笔录类型进行判断,分析同一案件编号下的人员关系;3)再进行笔录前后部分判断,用于人员基本信息提取及智能识别;4)接着将笔录信息中的人员信息提取和初步的人员关系对应,进行关系人智能识别,并将相关字符段和对应的字符段内容进行正向人工干预,得到结构型数据库,结构型数据库用于查询分析应用;5)最后通过反向人工干预在结构型数据库中记录形成一个修改数据库。2.根据权利要求1所述的一种在电子笔录中提取人员信息及关系人的方法,其特征在于:步骤1)中的所述笔录信息通过电子笔录系统或读取导入电子笔录文件的形式实现。3.根据权利要求2所述的一种在电子笔录中提取人员信息及关系人的方法,其特征在于:当接入所述电子笔录系统时,人员信息和家庭成员信息通过电子笔录系统的固定格式字符段直接读取,笔录问答内容中的人员信息和关系人信息通过关键词语智能识别字符段、智能语义解析算法判断该字符段对应...

【专利技术属性】
技术研发人员:王灵华王丽萍王小易倪杨喜
申请(专利权)人:王小易
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1