The invention discloses a method for extracting personnel information and related persons in electronic transcripts, which includes the following steps: firstly, case number correspondence is carried out for the recorded information; secondly, the type of transcripts is judged by intelligent recognition, and the relationship between persons under the same case number is analyzed; secondly, some judgments are made before and after the transcripts for the extraction of basic information and intelligent recognition of personnel; secondly, the pen is used for the extraction of basic information and intelligent recognition of personnel. Personnel information extraction in record information corresponds to the preliminary personnel relationship, and the intelligent recognition of relatives is carried out, and the related character segments and corresponding character segments are intervened forward manually to obtain a structured database, which is used for query and analysis applications. Finally, a modified database is recorded in the structured database through reverse manual intervention. The method of the invention can mine the idle information in the existing record information, greatly expand human resources, and the information source is real and reliable.
【技术实现步骤摘要】
一种在电子笔录中提取人员信息及关系人的方法
本专利技术涉及一种在电子笔录中提取人员信息及关系人的方法。
技术介绍
随着政府部门的信息化的推进,笔录系统等无纸化工具在公安、城管等政府部门普遍应用;即使在没有笔录系统的单位,word、wps等办公软件下的模版化、格式化电子笔录也已普及使用,由此生成了海量的word、wps、PDF等等各类文件类型的电子笔录。电子笔录中不仅记录了笔录对象的基本信息,还记录了笔录对象的家庭情况信息和相关涉案人员等关系人的信息,且人员关系相对明确固定,十分有利于人员关系的拓展。而与此同时,在政府部门的日常管理服务工作中,如公安机关的刑事侦查、治安管理等执法活动中,分析判断关系人以及判定人与人之间关系程度的需求十分迫切,也在户籍、暂住等业务系统中对一些同户人员、同暂住地人员等关系人信息实现了自动梳理,但目前笔录系统中的关系人信息尚不能自动梳理,无法为实际需求提供更有效服务。原因在于电子笔录中人员信息和反映的关系人信息是多以文字描述的形状存在,专业术语称之为“碎片化”、“非结构型数据”,而不是像户籍系统、流动人口管理等专业系统那样形成“关系型数据”或“结构型数据”,因而不能被其他关系人分析软件直接关联予以引用,导致笔录中的信息没有被充分挖掘利用。现实工作中,一方面是在电子笔录在日常工作中累积了大量的人员信息和关系信息,但却没有被充分利用,或被分散在各自的电脑里没有得到整合,另一方面却是同一部门对人员关系的迫切需求。因此,提取电子笔录中的人员信息和关系人信息,整合成一个结构型数据,既可提高对现有基础零散数据的利用,也可提高执法部门的工作效率 ...
【技术保护点】
1.一种在电子笔录中提取人员信息及关系人的方法,其特征在于包括以下步骤:1)首先对笔录信息进行案件编号对应;2)然后通过智能识别对笔录类型进行判断,分析同一案件编号下的人员关系;3)再进行笔录前后部分判断,用于人员基本信息提取及智能识别;4)接着将笔录信息中的人员信息提取和初步的人员关系对应,进行关系人智能识别,并将相关字符段和对应的字符段内容进行正向人工干预,得到结构型数据库,结构型数据库用于查询分析应用;5)最后通过反向人工干预在结构型数据库中记录形成一个修改数据库。
【技术特征摘要】
1.一种在电子笔录中提取人员信息及关系人的方法,其特征在于包括以下步骤:1)首先对笔录信息进行案件编号对应;2)然后通过智能识别对笔录类型进行判断,分析同一案件编号下的人员关系;3)再进行笔录前后部分判断,用于人员基本信息提取及智能识别;4)接着将笔录信息中的人员信息提取和初步的人员关系对应,进行关系人智能识别,并将相关字符段和对应的字符段内容进行正向人工干预,得到结构型数据库,结构型数据库用于查询分析应用;5)最后通过反向人工干预在结构型数据库中记录形成一个修改数据库。2.根据权利要求1所述的一种在电子笔录中提取人员信息及关系人的方法,其特征在于:步骤1)中的所述笔录信息通过电子笔录系统或读取导入电子笔录文件的形式实现。3.根据权利要求2所述的一种在电子笔录中提取人员信息及关系人的方法,其特征在于:当接入所述电子笔录系统时,人员信息和家庭成员信息通过电子笔录系统的固定格式字符段直接读取,笔录问答内容中的人员信息和关系人信息通过关键词语智能识别字符段、智能语义解析算法判断该字符段对应...
【专利技术属性】
技术研发人员:王灵华,王丽萍,王小易,倪杨喜,
申请(专利权)人:王小易,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。