卷宗结构化处理方法和装置制造方法及图纸

技术编号:22000427 阅读:19 留言:0更新日期:2019-08-31 05:27
本发明专利技术公开了一种卷宗结构化处理方法和装置。其中,该方法包括:将待处理纸质卷宗转化为电子卷宗;根据预设文书格式化规则对电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;对格式化后的电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的电子卷宗的业务逻辑段划分结果;从格式化后的电子卷宗的业务逻辑段中分别提取要素点信息;将要素点信息按照预设结构化模板进行组合,形成结构化文本。本发明专利技术解决了现有技术中采用人工输入卷宗要素点形成结构化文本的方法耗费人力成本、时间成本并且准确率低的技术问题。

Structured File Processing Method and Device

【技术实现步骤摘要】
卷宗结构化处理方法和装置
本专利技术涉及法律文本处理领域,具体而言,涉及一种卷宗结构化处理方法和装置。
技术介绍
随着智慧法院信息化建设步伐的推进,各级法院在组织、管理和建设趋于信息化是,而卷宗电子化、信息结构化也势必成为法院信息化建设的必要环节。目前将卷宗进行结构化处理的方法主要是:由用户参考纸质卷宗文本,输入卷宗文本中的要素点信息,然后在后台形成结构化文本,采用该方法达不到最高法院提出的信息化目的,需要耗费大量的人力成本和时间成本,并且人工输入会经常发生错误。针对上述现有技术中采用人工输入卷宗要素点形成结构化文本的方法耗费人力成本、时间成本并且准确率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种卷宗结构化处理方法和装置,以至少解决现有技术中采用人工输入卷宗要素点形成结构化文本的方法耗费人力成本、时间成本并且准确率低的技术问题。根据本专利技术实施例的一个方面,提供了一种卷宗结构化处理方法,包括:将待处理纸质卷宗转化为电子卷宗;根据预设文书格式化规则对电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;对格式化后的电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的电子卷宗的业务逻辑段划分结果;从格式化后的电子卷宗的业务逻辑段中分别提取要素点信息;将要素点信息按照预设结构化模板进行组合,形成结构化文本。根据本专利技术实施例的另一方面,还提供了一种卷宗结构化处理装置,包括:电子化模块,用于将待处理纸质卷宗转化为电子卷宗;格式化模块,用于根据预设文书格式化规则对电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;段落划分模块,用于对格式化后的电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的电子卷宗的业务逻辑段划分结果;要素提取模块,用于从格式化后的电子卷宗的业务逻辑段中分别提取要素点信息;组合模块,用于将要素点信息按照预设结构化模板进行组合,形成结构化文本。根据本专利技术实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述卷宗结构化处理方法。根据本专利技术实施例的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述卷宗结构化处理方法。在本专利技术实施例中,通过将待处理纸质卷宗转化为电子卷宗;根据预设文书格式化规则对电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;对格式化后的电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的电子卷宗的业务逻辑段划分结果;从格式化后的电子卷宗的业务逻辑段中分别提取要素点信息;将要素点信息按照预设结构化模板进行组合,形成结构化文本,达到了不需要用户参与即可快速形成结构化文本的目的,为生成各类判决书提供信息化的数据基础,从而实现了节约人力成本和时间成本,提高准确率的技术效果,进而解决了现有技术中采用人工输入卷宗要素点形成结构化文本的方法耗费人力成本、时间成本并且准确率低的技术问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种卷宗结构化处理方法的示意图;图2是根据本专利技术实施例的一种卷宗结构化处理装置的示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种卷宗结构化处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本专利技术实施例的卷宗结构化处理方法,如图1所示,该方法包括如下步骤:步骤S102,将待处理纸质卷宗转化为电子卷宗;步骤S104,根据预设文书格式化规则对电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;步骤S106,对格式化后的电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的电子卷宗的业务逻辑段划分结果;步骤S108,从格式化后的电子卷宗的业务逻辑段中分别提取要素点信息;步骤S110,将要素点信息按照预设结构化模板进行组合,形成结构化文本。具体的,步骤S102中将待处理纸质卷宗转化为电子卷宗时,可以采用打印机扫描的方式将待处理纸质卷宗转化为电子卷宗;步骤S104中根据预设文书格式化规则对电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗时,可以实现对电子卷宗的初步格式化处理,将不规范的数据转换为有格式的数据;步骤S106中得到的业务逻辑段划分结果,可以是多个业务逻辑段,其中每个业务逻辑段可以包括多个自然段;其中每个业务逻辑段中可以包括多个要素点信息,或者包括该业务逻辑段特有的要素点信息;在步骤S108中提取到所有业务逻辑段的要素点信息后,即可执行步骤S110,将所有的要素点信息进行组合。在本专利技术实施例中,通过将待处理纸质卷宗转化为电子卷宗;根据预设文书格式化规则对电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;对格式化后的电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的电子卷宗的业务逻辑段划分结果;从格式化后的电子卷宗的业务逻辑段中分别提取要素点信息;将要素点信息按照预设结构化模板进行组合,形成结构化文本,达到了不需要用户参与即可快速形成结构化文本的目的,为生成各类判决书提供信息化的数据基础,从而实现了节约人力成本和时间成本,提高准确率的技术效果,进而解决了现有技术中采用人工输入卷宗要素点形成结构化文本的方法耗费人力成本、时间成本并且准确率低的技术问题。在一种可选的实施例中,在步骤S110形成结构化文本后,还包括把结构化文本存储入数据库中,在后续可以根据业务需求,由其他系统从数据库中获取,或者由数据库推送给其他系统。在一种可选的实施例中,步骤S104中根据预设文书格式化规则对电子卷宗的内容进行格式化处理之前,还包括如下步骤:步骤S202,根据电子卷宗的内容,匹配电子卷宗所属的案件类型以及匹配电子卷宗在案件类型下的文书类型。具体的,可以根据电子卷宗的内容匹配电子卷宗的案件类型本文档来自技高网
...

【技术保护点】
1.一种卷宗结构化处理方法,其特征在于,包括:将待处理纸质卷宗转化为电子卷宗;根据预设文书格式化规则对所述电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;对格式化后的所述电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的所述电子卷宗的业务逻辑段划分结果;从格式化后的所述电子卷宗的业务逻辑段中分别提取要素点信息;将所述要素点信息按照预设结构化模板进行组合,形成结构化文本。

【技术特征摘要】
1.一种卷宗结构化处理方法,其特征在于,包括:将待处理纸质卷宗转化为电子卷宗;根据预设文书格式化规则对所述电子卷宗的内容进行格式化处理,得到格式化后的电子卷宗;对格式化后的所述电子卷宗进行段落逻辑分析,并根据分析结果得到格式化后的所述电子卷宗的业务逻辑段划分结果;从格式化后的所述电子卷宗的业务逻辑段中分别提取要素点信息;将所述要素点信息按照预设结构化模板进行组合,形成结构化文本。2.根据权利要求1所述的方法,其特征在于,根据预设文书格式化规则对所述电子卷宗的内容进行格式化处理之前,还包括如下步骤:根据所述电子卷宗的内容,匹配所述电子卷宗所属的案件类型以及匹配所述电子卷宗在所述案件类型下的文书类型。3.根据权利要求2所述的方法,其特征在于,对格式化后的所述电子卷宗进行段落逻辑分析,包括:根据所述电子卷宗的案件类型和文书类型确定格式化后的所述电子卷宗的逻辑段配置规则;根据所述逻辑段配置规则对格式化后的所述电子卷宗进行段落逻辑分析。4.根据权利要求2所述的方法,其特征在于,从格式化后的所述电子卷宗的业务逻辑段中分别提取要素点信息,包括:根据所述电子卷宗的案件类型和文书类型确定格式化后的所述电子卷宗的业务逻辑段中要素点信息配置规则;根据所述要素点信息配置规则从格式化后的所述电子卷宗的业务逻辑段中分别提取要素点信息。5.根据权利要求2所述的方法,其特征在于,将所述要素点信息按照预设结构化模板进行组合之前,还包括:根据所述电子卷宗的案件类型和文书类型确定所述电子卷宗所属的预设结构化模板。6.根据权利要求1-5中任意一项所述的方法...

【专利技术属性】
技术研发人员:麦天骥
申请(专利权)人:北京市律典通科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1